欢迎光临
免费的PDF电子书下载网站

R语言数据分析与挖掘实战手册 PDF下载

编辑推荐

暂无

内容简介

     本书系统地介绍了利用R 语言进行数据分析和挖掘的相关技术,采用由浅入深的框架体系:开篇伊始介绍R 语言的基础操作,进而介绍回归分析、方差分析等数据分析的方法,以更好地探索数据内部结构,获取数据所包含的信息;更重要的是为后续的数据挖掘提供理论依据;*后介绍典型数据挖掘工具和方法,采用理论基础到算法介绍到案例实战的布局,让读者深刻感知数据挖掘的精髓,在了解算法的同时更好地学以致用。

作者简介

    程静,毕业于重庆大学,目前就职于西部估值最高的互联网公司猪八戒网,担任高级数据分析工程师,负责行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测,擅长大数据分析及数据挖掘的各种算法熟练使用R语言及Python语言。

R语言数据分析与挖掘实战手册 PDF下载

目录

第1 章 R 语言简介

1.1 R 语言软件的安装与运行................................................................................................. 1

1.1.1 R 语言软件的安装、启动与关闭........................................................................... 1

1.1.2 R 语言程辑包的安装和使用.................................................................................. 4

1.2 R 语言的数据结构............................................................................................................. 6

1.2.1 R 语言对象和类型................................................................................................. 6

1.2.2 向量........................................................................................................................ 7

1.2.3 数组和矩阵........................................................................................................... 12

1.2.4 列表...................................................................................................................... 17

1.2.5 数据框.................................................................................................................. 20

第2 章 数据的读取与保存

2.1 数据的读取...................................................................................................................... 24

2.1.1 读取内置数据集和文本文件................................................................................ 24

2.1.2 读取Excel 数据和CSV 格式的数据.................................................................... 30

2.1.3 读取R 语言格式数据和网页数据........................................................................ 33

2.1.4 读取其他格式的数据........................................................................................... 34

2.2 数据保存.......................................................................................................................... 36

2.2.1 写出数据.............................................................................................................. 36

2.2.2 使用函数cat() ...................................................................................................... 37

2.2.3 保存为R 语言格式文件....................................................................................... 38

2.2.4 保存为其他类型文件........................................................................................... 39

第3 章 数据预处理

3.1 缺失值处理...................................................................................................................... 40

3.1.1 缺失值判断........................................................................................................... 40

3.1.2 缺失模型判断....................................................................................................... 44

3.1.3 常用处理方法....................................................................................................... 48

3.2 数据整理.......................................................................................................................... 53

3.2.1 数据合并.............................................................................................................. 53

3.2.2 选取子集.............................................................................................................. 56

3.2.3 数据转换.............................................................................................................. 59

第4 章 数据的探索性分析

4.1 基本绘图函数.................................................................................................................. 66

4.2 探索单个变量.................................................................................................................. 74

4.2.1 单组数据的图形描述........................................................................................... 74

4.2.2 单组数据的描述性分析....................................................................................... 79

4.3 探索多个变量.................................................................................................................. 81

4.3.1 两组数据的图形描述........................................................................................... 81

4.3.2 多组数据的图形描述........................................................................................... 85

4.3.3 多组数据的描述性统计....................................................................................... 88

4.4 其他图像探索.................................................................................................................. 90

第5 章 回归分析

5.1 一元线性回归.................................................................................................................. 94

5.1.1 模型简介.............................................................................................................. 94

5.1.2 函数介绍.............................................................................................................. 96

5.1.3 综合案例:iris 数据集的一元回归建模.............................................................. 97

5.2 多元线性回归.................................................................................................................. 99

5.2.1 模型简介.............................................................................................................. 99

5.2.2 综合案例:iris 数据集的多元回归建模............................................................ 100

5.3 变量的选择.................................................................................................................... 105

5.3.1 逐步回归方法简介及函数介绍.......................................................................... 105

5.3.2 综合案例:swiss 数据集的逐步回归建模......................................................... 106

5.3.3 岭回归的方法简介及函数介绍.......................................................................... 109

5.3.4 综合案例:longley 数据集的岭回归探索.......................................................... 110

5.3.5 lasso 回归方法简介及函数介绍......................................................................... 114

5.3.6 综合案例:longley 数据集的lasso 回归建模.................................................... 115

5.4 Logistic 回归.................................................................................................................. 117

5.4.1 模型简介............................................................................................................ 117

5.4.2 函数介绍............................................................................................................ 119

5.4.3 综合案例:iris 数据集的逻辑回归建模............................................................ 120

第6 章 方差分析

6.1 单因素方差分析............................................................................................................ 124

6.1.1 模型介绍............................................................................................................ 124

6.1.2 函数介绍............................................................................................................ 126

6.1.3 综合案例:不同治疗方法下胆固醇降低效果的差异性分析............................ 127

6.2 双因素方差分析............................................................................................................ 130

6.2.1 模型介绍............................................................................................................ 130

6.2.2 综合案例:不同剂量下老鼠妊娠重量的差异性分析........................................ 132

6.3 协方差分析.................................................................................................................... 136

6.3.1 模型简介............................................................................................................ 136

6.3.2 函数介绍............................................................................................................ 136

6.3.3 综合案例:hotdog 数据集的协方差分析........................................................... 137

第7 章 主成分分析和因子分析

7.1 降维的基本方法:主成分分析..................................................................................... 139

7.1.1 理论基础:原始变量的线性组合...................................................................... 139

7.1.2 模型介绍............................................................................................................ 141

7.1.3 函数介绍............................................................................................................ 143

7.1.4 综合案例:longley 数据集的变量降维及回归.................................................. 144

7.1.5 综合案例:longley 数据集的变量降维及回归(主成分回归)....................... 148

7.2 推广发展:因子分析.................................................................................................... 150

7.2.1 理论基础:多个变量综合为少数因子............................................................... 150

7.2.2 模型介绍............................................................................................................ 151

7.2.3 函数介绍............................................................................................................ 153

7.2.4 综合案例:能力和智商测试的因子分析探索................................................... 154

第8 章 判别分析

8.1 距离判别法.................................................................................................................... 160

8.1.1 理论基础:离谁近,就属于谁.......................................................................... 160

8.1.2 函数介绍............................................................................................................ 162

8.1.3 综合案例:基于距离判别的iris 数据集分类.................................................... 164

8.2 Bayes 判别法................................................................................................................. 168

8.2.1 理论基础:先验概率与错判损失...................................................................... 168

8.2.2 函数介绍............................................................................................................ 170

8.2.3 综合案例:基于iris 数据集的Bayes 判别分析................................................ 171

8.3 Fisher 判别法................................................................................................................. 171

8.3.1 理论基础:投影................................................................................................. 171

8.3.2 函数介绍............................................................................................................ 173

8.3.3 综合案例:基于Fisher 判别的iris 数据集分类................................................ 174

第9 章 常规聚类分析

9.1 深入了解聚类分析........................................................................................................ 178

9.1.1 差异与分类......................................................................................................... 178

9.1.2 主流的聚类算法................................................................................................. 179

9.2 动态聚类........................................................................................................................ 180

9.2.1 聚类的基本过程................................................................................................. 180

9.2.2 函数介绍............................................................................................................ 183

9.2.3 综合案例:基于随机生成序列的动态聚类....................................................... 184

9.3 层次聚类........................................................................................................................ 194

9.3.1 聚类的基本过程................................................................................................. 194

9.3.2 函数介绍............................................................................................................ 197

9.3.3 综合案例:基于UScitiesD 数据集的层次聚类................................................. 199

9.4 密度聚类........................................................................................................................ 202

9.4.1 聚类的基本过程................................................................................................. 202

9.4.2 函数介绍............................................................................................................ 202

9.4.3 综合案例:基于随机生成序列的密度聚类....................................................... 203

9.5 EM 聚类......................................................................................................................... 204

9.5.1 聚类的基本过程................................................................................................. 205

9.5.2 函数介绍............................................................................................................ 205

9.5.3 综合案例:基于iris 数据集的EM 聚类............................................................ 206

第10 章 关联规则

10.1 简单关联规则.............................................................................................................. 210

10.1.1 基本概念与表示形式....................................................................................... 210

10.1.2 评价简单关联规则的有效性和实用性............................................................. 211

10.2 序列关联规则.............................................................................................................. 212

10.2.1 差异与基本概念............................................................................................... 212

10.2.2 生成序列关联规则........................................................................................... 213

10.3 Apriori 算法................................................................................................................. 214

10.3.1 算法介绍:挖掘频繁项集................................................................................ 214

10.3.2 函数介绍.......................................................................................................... 215

10.3.3 综合案例:基于Titanic 数据集的关联规则挖掘............................................ 216

10.4 Eclat 算法.................................................................................................................... 224

10.4.1 算法介绍:自底向上的搜索............................................................................ 224

10.4.2 函数介绍.......................................................................................................... 224

10.4.3 综合案例:基于美国人口调查数据的关联规则挖掘...................................... 225

10.5 SPADE 算法................................................................................................................. 230

10.5.1 算法介绍:基于序列格的搜索和连接............................................................. 231

10.5.2 函数介绍.......................................................................................................... 232

10.5.3 综合案例:基于zaki 数据集的序列关联规则挖掘......................................... 233

第11 章 神经网络

11.1 深入了解人工神经网络............................................................................................... 239

11.1.1 生物神经元....................................................................................................... 240

11.1.2 人工神经元模型............................................................................................... 241

11.1.3 人工神经网络种类........................................................................................... 244

11.1.4 建立模型的一般步骤........................................................................................ 247

11.2 B-P 反向传播网络....................................................................................................... 248

11.2.1 B-P 反向传播网络模型.................................................................................... 248

11.2.2 算法介绍........................................................................................................... 249

11.2.3 函数介绍........................................................................................................... 250

11.3 综合案例:基于Boston 数据的波士顿郊区房价预测建模........................................ 252

R语言数据分析与挖掘实战手册 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:R语言数据分析与挖掘实战手册