欢迎光临
免费的PDF电子书下载网站

R语言数据分析与可视化从入门到精通 PDF下载

编辑推荐

1. 理论为辅、实践为主。本书涉及一些必要的理论知识,特别是在数据分析部分,但总体以实践为主,因此几乎每节都有大量的代码,方便读者实践。
2. 知识全面、系统。本书在介绍了R语言的基础知识后,从数据获取和导出、数据清理和操作、数据分析和可视化方面分别进行了探讨,内容由浅入深、循序渐进。
3. 案例广泛。本书中的案例涉及心理学、社会学、医学、商业和经济等领域,但并不需要读者具备这些领域的专业知识。
4. “新手问答”和“小试牛刀”知识模块。“新手问答”主要对读者学习过程中易出现的疑问或容易犯的错误进行针对性的解答;“小试牛刀”结合每章知识及相关技能,列举综合上机案例,让读者在学完一章内容后能及时回顾和练习,旨在让读者巩固知识、学以致用。

 ;

内容简介

  R语言是一个自由、免费、源代码开放的编程语言和环境,它提供了强大的数据分析功能和丰富的数据可视化手段。随着数据科学的快速发展,R语言已经成为数据分析领域炙手可热的通用语言。全书分为3篇共12章,具体内容如下。
  第1篇:入门篇(第1章~第3章)。本篇将带领读者逐步走进R语言的世界,帮助读者对R语言形成初步的认识,并学会如何获取和安装R语言,以及如何在需要时获取帮助。然后介绍R语言的一些基础知识,这些知识是灵活应用R语言的必要前提。*后重点介绍R语言函数的使用方法,同时也会涉及一些其他相关内容,如流程控制和R语言环境等。
  第2篇:进阶篇(第4章~第11章)。本篇介绍R语言数据管理、数据分析和数据可视化的三大威力,包括通过数据获取、导出、整合和清理等操作将零散的数据整合为可以分析处理的数据集的多种方法;并介绍一些常用基础统计和高级统计的实现方法,以及R语言的图形生成、图形修饰、外部绘图插件和图形展示等功能。
  第3篇:实战篇(第12章)。本篇通过一个实战案例,综合讲解R语言在数据处理与可视化分析方面的实战技能。

作者简介

程乾,长期从事教育测量和教育大数据分析,擅长教育测量技术、数据可视化、数据挖掘算法和数据库管理,并致力于R的推广和普及。

刘永,R语言极客,数据分析专家,曾任职于科大讯飞(深圳),新光在线(深圳),擅长数据管理、数据可视化、潜在分类分析、结构方程建模和统计计算,对R语言有深入研究。

高博,高级工程师,主要研究方向为云计算与大数据、数据可视化等,熟悉R语言、.Net、PHP、Python、DevOps、MySQL、SQLServer等技术和工具。参与编写了《代码的力量——Discuz!源码分析与插件开发实例进阶》《PHP MySQL AJAX Web开发给力起飞》《Java Web应用开发给力起飞》等图书。主持省部级纵向课题3项,参与纵向、横向课题16项,获得软件著作权12项。

R语言数据分析与可视化从入门到精通 PDF下载

目录

第1篇  ;入门篇第1章  ;R语言快速入门 /3

1.1  ;R语言及其历史 /4

1.1.1  ;R语言的源起 /4

1.1.2  ;R语言的版本更新 /4

1.2  ;R语言的优势和劣势 /5

1.2.1  ;R语言的优势 /5

1.2.2  ;R语言的劣势 /6

1.3  ;R语言的软件获取及安装 /6

1.3.1  ;获取R语言软件 /6

1.3.2  ;在Windows平台上安装 /7

1.3.3  ;在Linux平台上安装 /10

1.3.4  ;在Mac OS平台上安装 /11

1.4  ;R语言的辅助工具 /13

1.4.1  ;R GUI /13

1.4.2  ;RStudio /16

1.4.3  ;获取帮助 /19

1.5  ;新手问答 /21

1.6  ;小试牛刀:练习设置RStudio全局选项 /21

本章小结  /23

第2章  ;R语言的编程基础(上) /24

2.1  ;对象与变量 /25

2.1.1  ;对象 /25

2.1.2  ;变量 /26

2.1.3  ;变量的列举和删除 /28

2.2  ;数据类型 /30

2.2.1  ;常用数据类型 /31

2.2.2  ;特殊值 /31

2.3  ;数据结构 /32

2.3.1  ;向量 /32

2.3.2  ;矩阵和数组 /38

2.3.3  ;因子 /43

2.3.4  ;列表 /46

2.3.5  ;数据框 /50

2.3.6  ;原子向量和递归向量 /53

2.4  ;数学运算 /58

2.4.1  ;基础运算 /58

2.4.2  ;向量运算 /61

2.4.3  ;矩阵运算 /64

2.5  ;新手问答 /65

2.6  ;小试牛刀:提取数据框子集,并对部分列做统计计算 /66

本章小结  /67

第3章  ;R语言的编程基础(下) /68

3.1  ;流程控制 /69

3.1.1  ;repeat循环 /69

3.1.2  ;while循环 /70

3.1.3  ;for循环 /70

3.1.4  ;if…else语句 /72

3.1.5  ;switch语句 /73

3.2  ;编写R函数 /74

3.2.1  ;函数格式 /74

3.2.2  ;函数参数 /75

3.2.3  ;返回值 /77

3.2.4  ;函数调用 /77

3.3  ;R语言常用函数 /78

3.3.1  ;文件操作函数 /78

3.3.2  ;基础计算函数 /81

3.3.3  ;概率分布函数 /86

3.3.4  ;字符处理函数 /90

3.4  ;R包 /94

3.4.1  ;R包的管理 /94

3.4.2  ;R包的加载 /97

3.4.3  ;自定义R包 /98

3.5  ;环境空间 /103

3.5.1  ;环境空间的种类 /103

3.5.2  ;环境空间的使用方法 /104

3.5.3  ;环境空间的特征 /106

3.6  ;新手问答 /108

3.7  ;小试牛刀:编写函数并实现调用  /109

本章小结  /110

第2篇  ;进阶篇第

4章  ;R语言的数据获取与导出 /113

4.1  ;数据获取 /114

4.1.1  ;导入R语言系统格式数据 /114

4.1.2  ;导入带有分隔符的文本数据 /114

4.1.3  ;导入Excel数据 /115

4.1.4  ;读取数据库数据 /119

4.1.5  ;读取其他统计工具的数据 /128

4.1.6  ;从互联网抓取数据 /136

4.2  ;数据导出 /151

4.2.1  ;写入R语言系统格式的数据 /151

4.2.2  ;写入文本文件 /152

4.2.3  ;写入Excel文件 /152

4.2.4  ;写入数据库 /153

4.3  ;新手问答 /155

4.4  ;小试牛刀:比较R语言读/写文件的效率 /156

本章小结  /158

第5章  ;R语言的数据管理威力之数据操作 /159

5.1  ;R语言内置数据操作函数 /160

5.1.1  ;查看和编辑数据 /160

5.1.2  ;筛选 /163

5.1.3  ;合并 /165

5.1.4  ;分组和汇总 /168

5.1.5  ;排序 /170

5.1.6  ;转换 /173

5.2  ;数据重塑 /175

5.3  ;apply函数族 /178

5.3.1  ;apply()函数 /178

5.3.2  ;lapply()函数 /181

5.3.3  ;sapply()函数 /183

5.3.4  ;vapply()函数 /183

5.3.5  ;mapply()函数 /184

5.4  ;plyr扩展包 /184

5.5  用sqldf()函数实现数据框的SQL风格查询 /189

5.6  dplyr扩展包 /191

5.7  新手问答  /199

5.8  牛刀小试:对矩阵各列使用不同的

函数 /200

本章小结  /202

第6章  语言的数据分析威力之基本统计 /203

6.1  描述性统计 /204

6.1.1  描述性统计量 /204

6.1.2  列联表 /206

6.1.3  同时呈现多个统计量 /210

6.2  计数数据的检验 /215

6.2.1  卡方检验的基本原理 /215

6.2.2  在R语言中实现卡方检验 /216

6.3  相关分析 /220

6.3.1  相关的类型 /220

6.3.2  各种相关系数计算在R语言中的实现 /221

6.4  t检验 /224

6.4.1  独立样本t检验 /225

6.4.2  非独立样本t检验 /227

6.4.3  对t检验的前提假设进行检验 /228

6.5  方差分析 /230

6.5.1  方差分析的基本术语 /230

6.5.2  aov()函数 /231

6.5.3  单因素非重复测量方差分析 /232

6.5.4  单因素协方差分析 /235

6.5.5  单因素重复测量方差分析 /238

6.5.6  两因素方差分析 /240

6.5.7  对方差分析前提假设的检验 /242

6.6  非参数检验 /242

6.6.1  两总体比较 /243

6.6.2  多于两总体比较 /244

6.7  回归分析 /244

6.7.1  lm()函数 /245

6.7.2  模型拟合 /245

6.7.3  模型诊断 /249

6.7.4  模型改进 /251

6.8  新手问答 /257

6.9  小试牛刀:独立样本均值差异检验 /257

本章小结  /259

第7章  R语言的数据分析威力之高级方法 /262

7.1  判别分析 /263

7.1.1  判别分析的原理 /263

7.1.2  判别分析在R语言中的实现 /264

7.2  聚类分析 /273

7.2.1  聚类分析的原理 /274

7.2.2  聚类分析在R语言中的实现 /279

7.3  主成分分析 /289

7.3.1  主成分分析的原理 /289

7.3.2  主成分分析在R语言中的实现 /290

7.4  因子分析 /292

7.4.1  因子分析的原理 /293

7.4.2  因子分析在R语言中的实现 /295

7.5  新手问答 /302

7.6  小试牛刀:尝试实现层次聚类 /302

本章小结  /303

第8章  R语言的可视化威力之图形生成 /304

8.1  R语言绘图系统 /305

8.2  单变量绘图和双变量绘图 /305

8.2.1  散点图 /305

8.2.2  折线图 /309

8.2.3  条形图 /312

8.2.4  饼图 /314

8.2.5  箱线图 /315

8.2.6  直方图和核密度图 /317

8.3  多变量绘图 /319

8.3.1  气泡图 /319

8.3.2  热图 /321

8.3.3  马赛克图 /322

8.3.4  相关矩阵图 /325

8.3.5  三维散点图 /327

8.4  新手问答 /328

8.5  小试牛刀:将两个数据源绘制在同一个坐标系中 /329

本章小结  /330

第9章  R语言的可视化威力之图形优化 /331

9.1  添加图形元素 /332

9.1.1  坐标轴 /332

9.1.2  图例 /337

9.1.3  文本注解 /341

9.1.4  标题 /343

9.1.5  参考线 /344

9.1.6  线段和带箭头的线段 /346

9.1.7  矩形阴影 /347

9.2  控制图形外观 /348

9.2.1  整体外观 /348

9.2.2  局部外观 /351

9.2.3  文本 /352

9.2.4  线条 /353

9.2.5  矩形 /354

9.2.6  点的形状 /355

9.3  图形配色与布局 /356

9.3.1  颜色与调色板 /356

9.3.2  面板和分面 /362

9.3.3  图形组合 /365

9.4  新手问答 /368

9.5  小试牛刀:使用网格系统组合图形 /369

本章小结  /370

第10章  R语言的可视化威力之外部插件 /371

10.1  ggvis插件包 /372

10.1.1  ggivs与ggplot2的对比 /372

10.1.2  绘图语法 /374

10.1.3  图层 /377

10.1.4  图形修饰 /384

10.2  plotly插件包 /391

10.2.1  plotly插件包对ggplot2包绘图对象的扩展 /392

10.2.2  绘图语法 /393

10.2.3  绘图示例 /403

10.2.4  图形修饰 /416

10.3  新手问答 /422

10.4  小试牛刀:使用plotly插件包绘制组合图 /423

本章小结  /425

第11章  R语言的可视化威力之图形展示 /426

11.1  传统图形输出 /427

11.1.1  输出为位图文件 /427

11.1.2  输出为PDF文件 /428

11.1.3  输出为矢量图 /429

11.2  网页输出 /429

11.2.1  使用R Markdown输出为网页 /430

11.2.2  使用shiny输出为网页 /437

11.3  新手问答 /443

11.4  小试牛刀:将绘图输出为HTML文档 /444

本章小结  /446

第3篇  实战篇

第12章  R语言对产品性价比的数据分析与可视化 /449

12.1  数据采集 /450

12.1.1  分析页面结构 /450

12.1.2  编写爬虫程序 /454

12.1.3  抓取数据并保存 /463

12.2  数据清理 /463

12.2.1  变量(字符)拆分与抽取 /464

12.2.2  检测数据缺失与重复值 /466

12.2.3  变量类型转化与重命名 /468

12.3  数据分析与数据可视化 /470

12.3.1  探索性数据分析 /470

12.3.2  图书价格和评论指标的聚类分析 /484

12.3.3  图书性价比分析 /487

本章小结  /496

参考文献 /497

前沿

关于本书
R语言是一个自由、免费、源代码开放的编程语言和环境,是S语言的一个分支,多个操作系统都能方便且免费地使用它。R语言不仅具有众多经常更新的统计分析函数,还具有完整的编程功能和强大的绘图功能。
相比其他流行的编程语言和统计软件,R语言具有许多特性,如免费和开源、社区强大、资源丰富、帮助系统完备等。随着数据科学的快速发展,R语言在统计计算、数据分析和可视化,以及机器学习等方面逐渐成为一款重要的工具,并广泛应用于统计、计量经济、物理、生物、教育和心理学等诸多领域。
本书是关于R语言数据分析与可视化从入门到精通的指南,较为全面地介绍了R语言的常用功能和方法,且紧密围绕实际应用展开。例如,从R语言的发展历史到R语言的一些常用函数,从数据管理到数据分析,从基础统计到高级统计,从图形生成到图形优化,从分步应用到综合应用等。通过本书,读者可以掌握R语言的基本功能和原理,并进一步深入学习更多的相关知识。
本书内容
全书分为3篇,共12章,具体内容如下。
第1篇:入门篇(第1章~第3章)。本篇将带领读者逐步走进R语言的世界,帮助读者对R语言形成初步的认识,并学会如何获取和安装R语言,以及如何在需要的时候获取帮助。然后介绍R语言的一些基础知识,这些知识是灵活应用R语言的必要前提。最后重点介绍R语言的函数使用方法,同时也会涉及一些其他相关内容,如流程控制和R语言环境等。
第2篇:进阶篇(第4章~第11章)。本篇介绍R语言数据管理、数据分析和数据可视化的三大威力,包括通过数据获取、导出、整合和清理等操作将零散的数据整合为可以分析处理的数据集的多种方法;并介绍一些常用基础统计和高级统计的实现方法,以及R语言的图形生成、图形修饰、外部绘图插件和图形展示等功能。
第3篇:实战篇(第12章)。本篇通过一个实战案例,综合讲解R语言在数据处理与可视化分析方面的实战技能。
本书特点
本书系统地介绍了R语言在数据分析和可视化方面的应用,具有以下特点。
(1)理论为辅、实践为主。本书涉及一些必要的理论知识,特别是在数据分析部分,但总体以实践为主,因此几乎每节都有大量的代码,目的就是方便读者实践。
(2)知识全面、系统。本书从内容上按照数据分析的基本流程来编排,在介绍了R语言的基础知识后,从数据获取和导出、数据清理和操作、数据分析和可视化方面分别进行了探讨,内容由浅入深、循序渐进。
(3)案例广泛。本书中的案例涉及心理学、社会学、医学、商业和经济等领域,但并不需要读者具备这些领域的专业知识。
(4)除第12章外,每章结尾都配有“新手问答”和“小试牛刀”知识模块。“新手问答”主要对读者学习过程中易出现的疑问或容易犯的错误进行针对性的解答;“小试牛刀”结合每章知识及相关技能,列举综合上机案例,让读者在学完一章内容后能及时回顾和练习,旨在让读者巩固知识、学以致用。
读者对象
本书既适用于没有R语言编程基础的读者,也可以作为从事数据分析和可视化工作人员的参考用书。通过阅读本书,读者将掌握R语言的相关特性及其在数据分析和可视化方面的应用,可极大地提升自己的专业技能,使R语言成为真正的数据分析和可视化利器。此外,期望读者在阅读完本书后,能具备编写R语言程序、独立解决各类复杂问题的能力。
除了书,您还能得到什么?
(1)赠送:案例源代码。提供书中相关案例的源代码,方便读者学习参考。
(2)赠送:《微信高手技巧随身查》《QQ高手技巧随身查》《手机办公10招就够》三本电子书,“10 招精通超级时间整理术”视频教程,“5分钟学会番茄工作法”视频教程。
温馨提示:以上资源,请用微信扫描下方任意二维码关注公众号,输入代码194367,即可获取下载地址及密码。

本书由凤凰高新教育策划,由程乾、刘永、高博三位老师合作创作。在本书的编写过程中,我们竭尽所能地为您呈现最好、最全的实用内容,但仍难免有疏漏和不妥之处,敬请广大读者不吝指正。
读者信箱:2751801073@qq.com

免费在线读

R 语言是S 语言的一个分支,而S 语言则是由John Chambers、Rick Becker 和Allan Wilks 等人在贝尔实验室(前身为AT & T,现为朗讯科技)开发的一种用来进行数据探索、统计分析和作图的解释型语言。S 语言最初的实现版本主要是S-PLUS。S-PLUS 是一个商业软件,它基于S 语言,并被MathSoft 公司的统计科学部进一步完善。1995 年,奥克兰大学统计系的Ross Ihaka 和RobertGentleman 基于S 语言的源代码并结合Scheme 语言的语法,编写了一个能执行S 语言的软件。他们以两人名字的首字母将该软件命名为“R”,并公开了该软件的全部源代码,其命令统称为R 语言。因此R 语言其实也是S 语言的一种实现。
1997 年,由11 人组成的R 语言开发核心团队正式成立,负责R 语言的开发和维护。如今R语言核心开发团队已经达到25 人,成员来自世界知名大学和企业。由于R 语言具备出众的扩展性,其使用者越来越多,同时也吸引了大量的开发者编写自定义函数包供更多人使用。自2004 年开始,R 语言基金会几乎每年都支持R 语言社区成员组织的会议,世界各地的R 语言开发者和用户齐聚一堂,讨论R 语言的应用与科研方面的成果。此外,自2008 年开始,国内也定期举行中国R 语言会议,以推动R 语言在我国的普及。
截至2018 年12 月,R 语言在TIOBE 指数中排名第16 位,反映了R 语言的流行程度。

R语言数据分析与可视化从入门到精通 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:R语言数据分析与可视化从入门到精通