大数据数学基础与应用
ISBN:9787577008677
主编:李岚、刘孝艳、王浩亮、王学艳
出版社:电子科技大学出版社
出版/修订日期:2024年3月
¥ 53.80
本书是学习大数据分析的入门教材,强调数据挖掘中的数学理论基础。本书重视理论基础与实际案例的相互融合,从基本分类出发对数据进行分析,详细介绍各类数据处理的方法。本书主要内容包括:大数据分析中的基本矩阵运算、数值计算、多元统计分析、图论、信息论和优化理论,以及大数据分析的Python基础,包括数据预处理、数据分析的基本方法。
本书适用于高等院校数学、通信、计算机等相关专业学生学习,也适用于高等职业院校的相关专业学生学习,还可以作为其他读者的大数据入门参考书。
第 1 章 绪论
1. 1 数据和大数据
1. 2 大数据分析与挖掘要解决的问题
1. 3 大数据分析与挖掘的过程和功能
1. 4 大数据分析与挖掘工具
习题
第 2 章 数据特征分析
2. 1 数据类型
2. 2 相似性和相异性的度量
2. 3 数据的整理
2. 4 数据的描述性特征
习题
第 3 章 统计学
3. 1 统计学基本概念
3. 2 抽样及抽样分布
3. 3 参数估计与假设检验
3. 4 相关分析与回归分析
习题
第 4 章 矩阵论与优化
4. 1 向量范数
4. 2 矩阵范数
4. 3 矩阵分解
4. 4 矩阵微分
4. 5 矩阵广义逆
4. 6 最优化基础
4. 7 无约束优化
4. 8 约束优化的最优性条件
4. 9 罚函数法
4. 10 二次规划与序列二次规划
习题
第 5 章 图论与信息论基础
5. 1 图的基本定义
5. 2 图的基本属性和度量
5. 3 树
5. 4 图的表示存储与遍历
5. 5 神经网络
5. 6 拉普拉斯矩阵与图谱分析
5. 7 图论在数据分析与挖掘中的实践应用
5. 8 信息论
5. 9 信息论在数据分析与挖掘中的实践应用
习题
第 6 章 数据预处理及离群点检测
6. 1 数据清洗
6. 2 数据集成
6. 3 数据转换
6. 4 数据归约
6. 5 离群点检测
习题
第 7 章 数据分类算法
7. 1 数据分类概述
7. 2 k-最近邻分类算法
7. 3 决策树分类算法
7. 4 朴素贝叶斯分类算法
7. 5 支持向量机算法
习题
第 8 章 关联分析
8. 1 频繁模式挖掘
8. 2 频繁项集挖掘方法———Apriori 算法
8. 3 基于 FP-Tree 的关联规则挖掘算法———FP-Growth 算法
8. 4 序列模式挖掘
8. 5 序列模式挖掘方法———Apriori All 算法
8. 6 关联规则分析在数据分析与挖掘中的实践应用
习题
第 9 章 聚类分析
9. 1 聚类算法的分类
9. 2 k-means 算法
9. 3 mean-shift 算法
9. 4 DBSCAN 算法
9. 5 期望最大化算法
9. 6 层次聚类算法
习题
第 10 章 Python 数据分析基础
10. 1 Python 开发环境的搭建
10. 2 Python 语言简介
10. 3 NumPy 数组简介
10. 4 Pandas 数据简介
10. 5 Matplotlib 绘图简介
习题
参考文献