欢迎光临
免费的PDF电子书下载网站

零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析 PDF下载

编辑推荐

R语言与生俱来就拥有数据统计和分析的DNA,而且R语言本身并不是独立存在的程序设计语言。更准确地说,R语言以集成在一个R系统或环境中的方式呈现在我们面前,这个R系统集数据计算、数据处理、统计分析和图形绘制等软件包于一体,是一个完整的数据科学工具软件。

如今,以互联网大数据分析为基础的人工智能,如机器学习、商业智能、数据挖掘、文本挖掘、数据可视化等领域都渴求强大、高效的数据科学工具,这种渴求让R大放异彩。R 系统本身就是一个开放的系统,除了传统的数据统计分析/绘图等软件包,现在更增加了机器学习、数据和文本挖掘、大数据分析等相关的诸多程序包,让R语言在这些领域成为“光彩夺目”的明星。

如果你对上述热门的领域之一感兴趣,并且想将R引入你的工作或研究中,那么本书就是一本快速参考指南。本书也可以作为完全不懂 R 软件及数据分析的读者自学R语言的*本读物。 ;

内容简介

本书共分14章,内容主要有R语言简介、数据读取与写入的方法,条件判断、循环等流程控制以及自定义函数,高级绘图、低级绘图、交互式绘图的说明,决策树、支持向量机、人工神经网络的介绍,基本统计、机器学习、数据挖掘、文本挖掘、大数据分析的应用,层次聚类法、K平均聚类算法、模糊C平均聚类算法、聚类指标、基因算法及人工蜂群算法的应用。 本书适合没有程序设计经验、想要接触R语言的人以及对统计、机器学习、数据挖掘、文本挖掘、大数据分析有兴趣的人阅读。

作者简介

李仁钟,资深开发工程师.

零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析 PDF下载

目录

目 ; 录
第1章 ; R简介 1
1.1 ; 开始使用R软件 1
1.2 ; R对象 4
1.2.1 ; 向量 4
1.2.2 ; 数组 5
1.2.3 ; 矩阵 7
1.2.4 ; 数据框 9
1.2.5 ; 因子 11
1.2.6 ; 列表 11
1.2.7 ; 对象转换 12
第2章 ; 数据的读取与写入 14
2.1 ; 数据的读取 14
2.2 ; 数据的写入与数据集 17
2.3 ; RData 格式数据的写入与读取 18
2.4 ; 读取 SQL Server 数据库的数据 19
第3章 ; 流程控制及自定义函数 20
3.1 ; 条件执行 20
3.2 ; 循环控制 22
3.3 ; 自定义函数 25
第4章 ; 绘图功能及基本统计 27
4.1 ; 高级绘图 27
4.2 ; 低级绘图 30
4.3 ; 交互式绘图 31
4.4 ; 图形参数 32
4.5 ; 基本统计 34
第5章 ; 相关程序包的介绍 39
5.1 ; 机器学习 39
5.2 ; 数据挖掘 40
5.3 ; 社交网络分析及文本挖掘 40
5.4 ; 大数据分析 41
5.5 ; 程序包的介绍 41
第6章 ; 监督式学习 51
6.1 ; 决策树 51
6.2 ; 支持向量机 61
6.3 ; 人工神经网络 65
6.4 ; 组合方法 70
6.4.1 ; 随机森林 70
6.4.2 ; 推进法 71
第7章 ; 无监督式学习 72
7.1 ; 层次聚类法 72
7.2 ; K 平均聚类算法 75
7.3 ; 模糊C平均聚类算法 77
7.4 ; 聚类指标 83
第8章 ; 进化式学习 86
8.1 ; 基因算法 86
8.2 ; 人工蜂群算法 92

第9章 ; 混合式学习 95
9.1 ; 使用 C50 和 ABCoptim 程序包范例 95
9.2 ; 使用基因算法来调整人工神经网络参数的范例 97
第10章 ; 关联规则 107
10.1 ; 关联规则简介 107
10.2 ; Apriori 算法 108
第11章 ; 社交网络分析和文本挖掘 117
11.1 ; 社交网络分析 117
11.2 ; 文本挖掘 122
第12章 ; 图形化数据分析工具 125
12.1 ; 导入数据 126
12.1.1 ; 处理数据集 130
12.1.2 ; 设置变量 131
12.2 ; 探索和测试数据 131
12.3 ; 转换数据 135
12.4 ; 建立、评估和导出模型 137
第13章 ; 大数据分析 (R Hadoop) 141
13.1 ; Hadoop 简介 141
13.2 ; R Hadoop 142
第14章 ; SparkR 大数据分析 170
14.1 ; dplyr 数据处理程序包 172
14.2 ; SparkR 数据处理 175
14.3 ; SparkR 与 SQL Server 181
14.4 ; SparkR 与 Cassandra 184
14.5 ; Spark Standalone 模式 186
14.6 ; SparkR 数据分析 189
附录A ; 下载和安装 R 197
附录B ; 安装RStudio Desktop 203
附录C ; 安装ODBC 209
附录D ; 指令及用法 214
附录E ; 在虚拟机上安装 R Hadoop 218
附录F ; 在虚拟机上安装 SparkR 247
参考文献 272

前沿

前 ; 言
随着 R 软件的流行及普及化,许多学者和专家转而使用 R 作为研究与开发的工具。R软件有 Windows、UNIX、Linux及Apple MacOS等不同操作系统的免费版本,更有一万种以上免费程序包可供使用,所以学习R软件是睿智的选择。
本书内容共有14章,前4章先介绍 R 软件的基本操作和应用,第5章对本书所使用的程序包做完整的介绍,包含 R 软件在机器学习(Machine Learning)、数据挖掘(Data Mining)、文本挖掘(Text Mining)及大数据(Big Data)分析的相关程序包,第6~9章介绍各类学习算法,第10~12章介绍关联规则、网络社群分析及文本挖掘、图形化数据分析工具,最后两章介绍 Hadoop 和 Spark 大数据分析。
本书是作者多年来从事教学的心血结晶,适合作为大专院校信息类相关科系的教材,同时书中范例的程序代码丰富,也可作为练习的补充教材。本书的撰写以完全不懂R软件及数据分析的读者为对象,对于有意愿自学的读者而言,本书也是一本不错的入门参考书。
本书配套范例程序可从下面的网址(注意区分数字和字母大小写)下载或扫描右边的二维码获取:
https://pan.baidu.com/s/17b-xnYfhICguW4wSz8pWXA
如果下载有问题,请联系booksaga@126.com,邮件主题为“零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析”。

本书的撰写虽已力求完美,但难免会有疏漏之处,欢迎各位读者指教。

李仁钟、李秋缘
2018年6月

零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析