欢迎光临
免费的PDF电子书下载网站

Python机器学习开发实战 PDF下载

编辑推荐

1.详细讲解Python基础,针对机器学习重点有的放矢。 2.12个经典机器学习算法,由浅入深,有机结合。 3.每章都有相应的代码和案例,侧重实战开发。 4.大量的图片介绍,让算法不再枯燥难懂。 5.介绍现阶段*流行的深度学习框架,实现由机器学习到深度学习的转化。

内容简介

本书一共分为19章,1~7章是编程基础,为了让那些没有编程经验的但是又想从事数据分析工作的学员有个入门的基础。8~19章则介绍了机器学习领域中常用的算法,他们分别是线性回归,逻辑回归,神经网络,线性判别,*近邻算法,决策树与随机森林,朴素贝叶斯,支持向量机,主成分分析,奇异值分解,k-means聚类。在第19章中则着重介绍了现在比较流行的深度学习框架。

作者简介

王新宇,上海大学副教授,主讲机器学习课程,研究方向包括金融行业大数据挖掘、医学行业大数据挖掘、图像识别以及高性能计算。

Python机器学习开发实战 PDF下载

目录

第1章 环境配置与准备知识 1

1.1 环境配置 1

1.2 机器学习相关概念 2

1.2.1 机器学习中的数据 2

1.2.2 训练集和测试集 4

1.2.3 欠拟合与过度拟合 5

1.2.4 人工智能、机器学习、深度

学习 5

第2章 Python基础知识 6

2.1 hello world! 6

2.2 变量 6

2.3 操作符 7

2.3.1 基本运算符 7

2.3.2 比较运算符 8

2.3.3 逻辑运算符 10

2.4 字符串 11

2.4.1 基础 11

2.4.2 转义字符 12

2.4.3 索引和切片 13

2.4.4 字符串方法 14

2.5 列表 18

2.6 集合 21

2.7 字典 22

2.8 循环语句 24

2.9 判断语句 26

2.10 函数 26

2.11 面向对象编程 29

第3章 数值计算扩展工具——

Numpy 31

3.1 创建数组 31

3.1.1 创建元素为0或1的数组 31

3.1.2 将列表转换为数组 33

3.1.3 生成一串数字 33

3.1.4 生成特殊数组 34

3.2 数组索引 35

3.3 排序与查询 36

3.4 随机数生成器 39

3.5 数学函数 41

3.5.1 三角函数 41

3.5.2 指数与对数 43

3.5.3 约数 43

3.5.4 数组自身加乘 44

3.5.5 算术运算 45

3.6 统计函数 47

3.7 线性代数 50

第4章 数据分析工具——

Pandas 52

4.1 序列对象Series 52

4.1.1 创建Series对象 52

4.1.2 Series索引 53

4.1.3 查看Series相关属性 56

4.1.4 二元运算 57

4.1.5 统计方法 62

4.1.6 缺失值处理 65

4.1.7 排序 66

4.1.8 计数与重复 67

4.1.9 其他 69

4.2 数据框对象DataFrame 70

4.2.1 创建数据框 70

4.2.2 行操作 71

4.2.3 列操作 73

4.3 分组对象GroupBy 75

4.3.1 基本函数 75

4.3.2 统计函数 77

第5章 可视化展示库——

Matplotlib 80

5.1 作图类命令 80

5.1.1 折线图 80

5.1.2 柱状图和条形图 82

5.1.3 散点图 84

5.1.4 饼图 85

5.1.5 面积图 86

5.2 坐标轴控制 88

5.2.1 axis 88

5.2.2 xlim与ylim 89

5.2.3 xticks与yticks 90

5.2.4 xlabel与ylabel 90

5.3 其他设置 91

第6章 通用型开源机器学习库——

Scikit 93

6.1 预处理 94

6.1.1 标准化 95

6.1.2 非线性转换 96

6.1.3 归一化 97

6.1.4 二值化 97

6.1.5 分类特征编码 98

6.1.6 缺失值插补 99

6.1.7 生成多项式特征 100

6.2 降维 101

6.3 有监督学习与无监督学习 101

6.4 模型评估 102

6.4.1 测试集评分 102

6.4.2 交叉验证迭代器 105

6.4.3 分层交叉验证迭代器 108

6.4.4 分组迭代器 109

6.4.5 时间序列交叉验证 111

第7章 机器学习常用数据集 112

7.1 boston房价数据集 112

7.1.1 数据集基本信息描述 112

7.1.2 数据探索 113

7.2 diabetes糖尿病数据集 115

7.2.1 数据基本信息描述 116

7.2.2 数据探索 116

7.3 digits手写字体识别数据集 117

7.3.1 数据集基本信息描述 124

7.3.2 数据集探索 124

7.4 iris鸢尾花数据集 127

7.4.1 数据集基本信息描述 127

7.4.2 数据探索 128

7.5 wine红酒数据集 131

7.5.1 数据集基本信息描述 131

7.5.2 数据探索 132

第8章 线性回归算法 134

8.1 从二次函数到机器学习 134

8.1.1 二次函数最优求解方法 134

8.1.2 梯度下降 135

8.1.3 梯度下降的Python实现 138

8.1.4 初始值与学习速率? 的选择 139

8.2 深入理解线性回归算法 142

8.2.1 回归曲线的数学解释 143

8.2.2 梯度下降方法求解最优直线 144

8.2.3 理解“机器学习”中的

“学习” 145

8.2.4 导数求解与梯度下降 145

8.2.5 学习速率? 与迭代次数的设置 146

8.3 线性回归算法实战——糖尿病患者

病情预测 146

第9章 逻辑回归算法 149

9.1 逻辑回归算法的基础知识 149

9.1.1 直线分割平面 149

9.1.2 逻辑函数 153

9.2 深入理解逻辑回归算法 155

9.2.1 直线分类器与逻辑回归的结合 155

9.2.2 Sigmoid函数的作用 158

9.2.3 逻辑回归模型 159

9.3 逻辑回归算法实战—— 二维鸢尾花

分类 160

第10章 神经网络算法 164

10.1 神经网络算法的基础知识 164

10.1.1 逻辑回归与神经网络的关系 165

10.1.2 激活函数 165

10.2 深入理解神经网络算法 167

10.2.1 神经网络的表示 167

10.2.2 做回归的神经网络 168

10.2.3 做二分类的神经网络 168

10.2.4 做多分类的神经网络 169

10.3 神经网络的应用 169

10.3.1 MLPClassifier分类 169

10.3.2 MLPRegressor回归 171

第11章 线性判别算法 173

11.1 线性判别算法的核心知识 173

11.1.1 方差 173

11.1.2 投影 175

11.1.3 投影方式与方差的关系 177

11.2 线性判别算法详解 178

11.2.1 投影的实际应用 179

11.2.2 另一种思路解决重叠问题 180

11.2.3 线性判别算法的实质 182

11.3 线性判别算法实战—— 花卉分类 183

第12章 K最近邻算法 187

12.1 K最近邻算法的核心知识 187

12.1.1 两点的距离公式 187

12.1.2 权重 188

12.2 K最近邻算法详解 188

12.2.1 K最近邻算法原理 188

12.2.2 K最近邻算法的关键—— k的

选择 191

12.2.3 距离加权最近邻算法 191

12.3 K最近邻算法实战—— 手写字体

识别 192

第13章 决策树方法与随机

森林 194

13.1 决策树方法的基本知识 194

13.2 决策树方法的原理 197

13.2.1 信息熵 198

13.2.2 分割数据 199

13.2.3 计算信息增益 201

13.3 决策树方法实战—— 红酒分类 204

13.4 随机森林 205

第14章 贝叶斯算法 206

14.1 贝叶斯算法的基础知识 206

14.1.1 概率 206

14.1.2 条件概率 207

14.1.3 联合概率 209

14.1.4 贝叶斯定理 210

14.2 深入理解贝叶斯算法 210

14.2.1 先验概率和后验概率 211

14.2.2 词向量 211

14.2.3 贝叶斯模型 214

14.3 贝叶斯算法实战—— 文本分类 222

第15章 支持向量机 225

15.1 支持向量机的基础知识 225

15.1.1 向量 225

15.1.2 点积 228

15.1.3 投影 229

15.1.4 向量与代数直线的关系 230

15.2 深入理解支持向量机 233

15.2.1 超平面 233

15.2.2 支持向量机在二维空间的

超平面 234

15.2.3 计算最优超平面 235

15.3 支持向量机实战—— 鸢尾花分类 237

第16章 PCA降维算法 240

16.1 PCA降维算法的核心知识 240

16.1.1 矩阵的直观理解 240

16.1.2 特征向量的本质 243

16.1.3 协方差 244

16.1.4 协方差矩阵 244

16.2 PCA降维算法详解 244

16.2.1 协方差矩阵的特征向量 245

16.2.2 PCA降维算法的Python

实现 246

16.3 PCA降维算法实战—— iris数据集

可视化 247

第17章 SVD奇异值分解 249

17.1 SVD奇异值分解的相关知识 249

17.2 深入理解矩阵作用 250

17.2.1 矩阵作用 250

17.2.2 将矩阵作用分解为特征向量

作用 251

17.2.3 将矩阵作用分解为奇异矩阵

作用 253

17.3 SVD奇异值分解的应用 255

17.3.1 U矩阵的理解 257

17.3.2 V矩阵的理解 258

17.3.3 S矩阵的理解 259

第18章 聚类算法 260

18.1 深入理解K均值聚类算法 260

18.2 Scikit库中的K均值聚类算法 264

18.3 其他聚类算法 266

第19章 深度学习框架及其

应用 269

19.1 TensorFlow 269

19.1.1 TensorFlow的基本概念 269

19.1.2 TensorFlow的应用 271

19.2 Keras 277

19.3 PyTorch 282

19.4 Caffe 288





Python机器学习开发实战 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:Python机器学习开发实战