欢迎光临
免费的PDF电子书下载网站

Python机器学习及实践 PDF下载

编辑推荐

《Python机器学习及实践》内容由浅入深,既有原理介绍,又有实战操作,使读者在实践中掌握相关知识,并为解决问题提供详细的方法。
《Python机器学习及实践》具有超强的实用性,实例丰富,书中给出了80多个实例让读者理解概念、原理和算法。
《Python机器学习及实践》以理论与实践相结合为出发点,介绍Python机器学习的相关内容,即使没有机器学习基础的读者也可以快速上手。

 ;

内容简介

Python是目前比较热门的编程语言,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的*语言。本书以Python 3.6.5为编写平台,以帮助读者快速上手、理论与实践相结合为出发点,介绍Python机器学习的相关内容。全书共10章,分别介绍了机器学习的基础知识、近邻法、数据降维、分类算法、回归算法、聚类算法、神经网络、推荐算法、频繁项集、数据预处理。通过本书的学习,读者可了解Python编程及在机器学习中的应用。 本书可作为对Python和机器学习感兴趣的初学者的参考书,也可作为从事Python开发的广大科研人员、学者、工程技术人员的参考书,还可作为高等院校人工智能、计算机等相关专业的教材。

作者简介

暂无

Python机器学习及实践 PDF下载

目录

目录

 ;

第1章机器学习的基础知识

1.1何谓机器学习

1.1.1传感器和海量数据

1.1.2机器学习的重要性

1.1.3机器学习的表现

1.1.4机器学习的主要任务

1.1.5选择合适的算法

1.1.6机器学习程序的步骤

1.2综合分类

1.3推荐系统和深度学习

1.3.1推荐系统

1.3.2深度学习

1.4何为Python

1.4.1使用Python软件的由来

1.4.2为什么使用Python

1.4.3Python设计定位

1.4.4Python的优缺点

1.4.5Python的应用

1.5Python编程第一步

1.6NumPy函数库基础

1.7Python迭代器与生成器

1.7.1迭代器

1.7.2生成器

1.8多线程

1.8.1学习Python线程

1.8.2线程模块

1.8.3线程同步

1.8.4线程优先级队列(Queue)

1.9小结

1.10习题

第2章Python近邻法

2.1k近邻法的三要素

2.1.1k值选择

2.1.2距离度量

2.1.3分类决策规则

2.2k近邻法

2.3kd树

2.3.1什么是kd树

2.3.2如何构建kd树

2.3.3如何在kd树中搜索

2.4Python实现kd树、k近邻法

2.5小结

2.6习题

第3章Python数据降维

3.1维度灾难与降维

3.2主成分分析

3.2.1PCA原理

3.2.2PCA算法

3.2.3PCA降维的两个准则

3.3SVD降维

3.4核主成分分析降维

3.5流形学习降维

3.6多维缩放降维

3.6.1原理

3.6.2MDS算法

3.7等度量映射降维

3.8局部线性嵌入

3.8.1原理

3.8.2LLE算法

3.9非负矩阵分解

3.10小结

3.11习题

第4章Python分类算法

4.1逻辑回归

4.1.1逻辑回归模型

4.1.2梯度下降法

4.2Softmax回归

4.3因子分解机

4.3.1逻辑回归算法的不足

4.3.2因子分解模型

4.3.3FM算法中交叉项的处理

4.3.4FM算法的求解

4.3.5FM算法流程

4.3.6Python实现FM模型

4.4支持向量机

4.4.1SVM简介

4.4.2线性可分支持向量机

4.4.3函数间距和几何间距

4.4.4线性支持向量机

4.4.5非线性支持向量机

4.5贝叶斯分类器

4.5.1贝叶斯定理

4.5.2相关的概念

4.5.3常用贝叶斯分类器

4.6随机森林

4.6.1决策树分类器

4.6.2CART分类树算法

4.7小结

4.8习题

第5章Python回归算法

5.1线性回归

5.1.1基本线性回归

5.1.2线性回归的最小二乘解法

5.1.3牛顿法

5.1.4局部加权线性回归

5.2岭回归与Lasso回归

5.2.1线性回归存在的问题

5.2.2岭回归模型

5.2.3Lasso回归模型

5.2.4拟牛顿法

5.2.5LBFGS求解岭回归模型

5.3小结

5.4习题

第6章Python聚类算法

6.1kMeans算法

6.1.1相似性的度量

6.1.2kMeans算法原理

6.1.3kMeans 算法

6.2Mean Shift聚类算法

6.2.1Mean Shift向量

6.2.2核函数

6.2.3Mean Shift推导

6.2.4Mean Shift在图像上的聚类

6.3DBSCAN聚类

6.3.1密度聚类原理

6.3.2DBSCAN密度定义

6.3.3DBSCAN密度聚类思想

6.3.4DBSCAN聚类算法

6.3.5DBSCAN小结

6.4小结

6.5习题

第7章Python神经网络

7.1感知机

7.1.1感知机原理

7.1.2感知机模型

7.1.3感知机学习策略

7.1.4感知机学习算法

7.1.5神经网络

7.1.6感知机的实现

7.2BP神经网络

7.2.1BP神经网络原理

7.2.2BP神经网络的实现

7.3径向基神经网络

7.3.1径向基函数解决插值问题

7.3.2正则化理论

7.3.3正则化RBF网络

7.3.4广义RBF网络

7.3.5数据中心的监督学习算法

7.4小结

7.5习题

第8章Python推荐算法

8.1协同过滤算法

8.1.1协同过滤算法概述

8.1.2协同过滤算法的分类

8.1.3相似度的度量方法

8.1.4基于用户的协同过滤算法

8.1.5基于项的协同过滤算法

8.1.6基于物品的协同过滤算法

8.2基于矩阵分解的推荐算法

8.2.1矩阵分解

8.2.2基于矩阵分解的推荐算法

8.2.3非负矩阵分解

8.3基于图的推荐算法

8.3.1二部图

8.3.2由用户商品矩阵到二部图

8.3.3PageRank算法

8.3.4问题说明

8.4小结

8.5习题

第9章Python频繁项集

9.1关联分析

9.1.1支持度与置信度

9.1.2穷举法

9.2Apriori算法

9.2.1Apriori算法简介

9.2.2Apriori定理

9.2.3Apriori算法应用

9.2.4Python生成候选项集

9.3FPGrowth算法

9.3.1用FP树编码数据集

9.3.2从FP树中挖掘频繁项

9.3.3从新闻网站点击流中挖掘

9.4小结

9.5习题

第10章Python数据预处理

10.1概述

10.1.1为什么要对数据预处理

10.1.2数据预处理的主要任务

10.2数据清理

10.2.1数据缺失

10.2.2过滤数据

10.2.3检测和过滤异常值 ;

10.2.4移除重复数据 ;

10.3处理缺失值

10.3.1处理缺失值的方法

10.3.2缺失值补全法

10.3.3特征编码

10.3.4数据标准化、正则化

10.3.5特征选择

10.3.6稀疏表示和字典学习

10.4机器模型

10.4.1损失函数和风险函数

10.4.2模型评估

10.4.3性能度量

10.5小结

10.6习题

参考文献

 ;

前沿

前言
机器学习(Machine Learning,ML)是多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
由于Python语言的简洁性、易读性及可扩展性,在国外用Python做科学计算的研究机构日益增多,一些知名大学也采用Python来教授程序设计课程,Python已经成为最受欢迎的程序设计语言之一。
Python在设计上坚持清晰划一的风格,这使得Python成为一门易读、易维护,并且被大量用户欢迎的、用途广泛的语言。
本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。书中讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。不管你是机器学习的初学者,还是想进一步拓展对机器学习领域的认知,本书都是一个重要且不可错失的资源,它能帮助你了解如何使用Python解决机器学习中的关键问题。
之所以学习Python,用Python解决机器问题,是因为Python对于大数据的提取、分析完全是没有压力的,这也与其自身的特点有关。
本书共10章,从各方面介绍了机器学习内容,主要包括:
第1章机器学习的基础知识,主要介绍了机器学习的概念、综合分类、推荐系统和深度学习、Python软件相关介绍等内容。
第2章Python近邻法,主要介绍了k近邻法三要素、k近邻法、kd树等内容。
第3章Python数据降维,主要介绍了维度灾难与降维、主成分分析、SVD降维、多维缩放降维等内容。
第4章Python分类算法,主要介绍了逻辑回归、Softmax回归、因子分解机、支持向量机、随机森林的内容。
第5章Python回归算法,主要介绍了线性回归、岭回归与Lasso回归的内容。
第6章Python聚类算法,主要介绍了kMeans算法、Mean Shift聚类算法、DBSCAN聚类的内容。
第7章Python神经网络,主要介绍了感知机、BP神经网络、径向基神经网络的内容。
第8章Python推荐算法,主要介绍了协同过滤算法、基于矩阵分解的推荐算法、基于图的推荐算法的内容。
第9章Python频繁项集,主要介绍了关联分析、Apriori算法、FPGrowth算法的内容。
第10章Python数据预处理,主要介绍了数据预处理的基本概述、数据清理、处理缺失值、机器模型的内容。
这些算法目前应用非常广泛,效果也不错,是机器学习的入门知识,另外还需要深入理解算法的原理、优劣势等特点以及应用场景,要掌握利用Python解决这些问题的方法,并达到应用自如的程度。
本书特点
 每个章节都是理论与Python实例相结合进行编写,让读者快速掌握利用Python实现机器学习算法;
 每章最后通过小结与习题进行章节内容的总结与掌握情况的检测,习题类型有填空题、问答题、编写题,这样可使读者做到学以致用,上手快。
 本书提供PPT课件、程序代码、习题答案等资料,请扫描下方二维码获取。

配套资料

 ;

本书主要由梁佩莹编写,此外参加编写的还有王宇华、吴茂、辛焕平、李晓东、李丹、李炳辉、顾艳春、方清城、邓奋发、周品、赵书兰、杨文茵。
由于时间仓促,加之编者水平有限,书中疏漏之处在所难免。在此,诚恳地希望得到各领域的专家和广大读者的批评指正。
编者

2020年2月

免费在线读

第5章
CHAPTER 5

Python回归算法

 ;

 ;

回归(Regression)是另一类重要的监督学习算法。与分类问题不同的是,在回归问题中,其目标是通过对训练样本的学习,得到从样本特征到样本标签之间的映射,其中,在回归问题中,样本标签是连续值。典型的回归问题有: ;
(1) 根据人的身高、性别和体重等信息预测其鞋子的大小; ;
(2) 根据房屋的面积、卧室的数量预测房屋的价格等。
5.1线性回归
线性回归(Linear Regression)是一类重要的回归问题。在线性回归中,目标值与特征之间存在线性相关的关系。
5.1.1基本线性回归
1.  ;线性回归的模型

对于线性回归算法,我们希望从训练数据中学习到线性回归方程,即

y=b ∑ni=1wi·xi

其中,b称为偏置,wi为回归系数。对于上式,令x0=1,则上式可以表示为: ;

y=∑ni=0wi·xi

2.  ;线性回归模型的损失函数
在线性回归模型中,其目标是求出线性回归方程,即求出线性回归方程中的回归系数wi。线性回归的评价是指如何度量预测值(Prediction)与标签(Label)之间的接近程度,线性回归模型的损失函数可以是绝对损失(Absolute Loss)或者平方损失(Squared Loss)。其中,绝对损失函数为: ;

l=y-y^

式中的y^为预测值,且y^=∑ni=0wi·xi。
平方损失函数为: ;

l=(y-y^)2

由于平方损失处处可导,所以通常使用平方误差作为线性回归模型的损失函数。假设有m个训练样本,每个样本中有n-1个特征,则平方误差可以表示为: ;

l=12∑mi=1y(i)-∑n-1j=0wj·x(i)j2

对于如上的损失函数,线性回归的求解是希望求得平方误差的最小值。
【例51】(二维直线例子)已知线性方程y=a*x b表示平面上的一直线。在下面的例子中,根据房屋面积、房屋价格的历史数据,建立线性回归模型。然后,根据给出的房屋面积,来预测房屋价格。房屋的数据为: ;

square_feetprice

0150 6450

1200 7450

2250 8450

3300 9450

435011450

540015450

660018450

实现的Python代码为: ;

import pandas as pd

from io import StringIO

from sklearn import linear_model

import matplotlib.pyplot as plt

 ;

#房屋面积与价格历史数据(csv文件)

csv_data = square_feet,price\n150,6450\n200,7450\n250,8450\n300,9450\n350,11450\n400,15450\n600,18450\n

#读入dataframe

df = pd.read_csv(StringIO(csv_data))

print(df)

#建立线性回归模型

regr = linear_model.LinearRegression()

#拟合

regr.fit(df[square_feet].values.reshape(-1, 1), df[price])  ;#注意此处.reshape(-1, 1),因为X是一维的!

#不难得到直线的斜率、截距

a, b = regr.coef_, regr.intercept_

#给出待预测面积

area = 238.5

#方式1:根据直线方程计算的价格

print(a * area b)

Python机器学习及实践 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:Python机器学习及实践