欢迎光临
免费的PDF电子书下载网站

数据科学中的R语言(R语言应用系列) PDF下载

编辑推荐

数据科学是将数据转化为行动的艺术,是综合了统计学、计算机科学和领域知识的新兴学科。数据科学与很多传统学科的*区别在于其为应用而生,因此本书一切从实际应用出发,以R语言为核心工具,介绍了各类分析方法的实现及其在各领域的应用情况。

 ;

  • 如果是初学者,可以从编程篇开始阅读,了解R语言的基本特点。
  • 如果是程序员,在迅速掌握语法后,可以深入研究模型篇,学习如何用统计学和其他流行的分析方法来描绘复杂的数据世界。
  • 如果关心数据价值的落地,应用篇必不负你所望,金融、制药、文本挖掘、社交网络、地理信息、高性能计算、可重复研究,这些*热门的行业和应用领域的案例将会为你带来数据应用的*真实的体验。

 ;

本书适用于所有对数据应用感兴趣的读者,也适合作为统计和数据分析的实务操作型课程的教材。

 ;

内容简介

本书是一本R语言的实战应用类书籍,已被列入到“R语言应用系列”,目标受众为缺乏编程基础,但很需要进行数据分析的读者。本书会从R语言的基础语法以及统计学的简单方法讲起,帮助读者快速入门,然后循序渐进地使读者跟随书中的例子进入到进阶训练,*后应用到实际的案例中去。

本书的特点在于行业应用的例子,包含了从传统的统计分析领域如新药研发、金融分析到当前*热门的大数据、社交网络等应用。所有的案例都会写成R函数并做成R语言软件包作为随书的赠品,方便读者应用到实际的工作中。  ;

作者简介

李舰,先后就读于中国人民大学统计学院(本科)和北京大学软件与微电子学院(研究生),现为英国芒果商务咨询有限公司上海代表处的首席顾问。有十年的R语言工程运用经验,积累了各行业大量的R应用案例。在国内最大的统计学论坛“统计之都”担任核心管理职务,也是国内R语言大会的发起人和大会主席。第二作者肖凯是著名的R语言博客博主,有丰富的R语言应用和写作经验。

数据科学中的R语言(R语言应用系列) PDF下载

目录

1引言:数据科学与R ; ; ; ; ; ; ; ; ;

 ;第2 数据对象

第3 ; 数据操作  ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;

4章 控制语句与函数

5章 面向对象  ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;

第6章 统计模型与回归分析

7章 其他统计分析方法  ; ; ; ; ; ; ; ; ; ;

第8章 数据挖掘和机器学习

9章 最优化方法  ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;  

第10章 数据可视化

11章 R在热门行业中的应用        

第12章 R与互联网文本挖掘

13章 大数据时代下的R              

第14章 可重复的数据分析

15章 R与其他系统的交互           

第16章 R与高性能运算

媒体评论

写一本书的后记可能是*愉快的时候,就像是一场马拉松看到了终点线。这只是比喻,当然我没有跑过。

不记得我们是在什么时间正式起跑的,这本书的缘由还得回溯到第五届北京R 会,也就是2012 年的初夏。当时李颖撺掇我们写一本原创的R 语言书。正好空闲时间还挺多,就答应了下来。回家后就和李舰合计大纲。马拉松在起跑的时候大家体力还不错,比较乐观的样子。当时我们预计可以在2013 年夏天完成初稿,还在ggplot2 的那本书的后面挂上了本书的新书预告,一时之间引来众多垂询。当时挖的一个大坑,现在终于要补上了。

李舰有软件工程背景,把写书也看作是一项工程,目录定好后给我发来一份长长的攻略,搭建写书环境。于是乎Eclipse 走起来,SVN 走起来了,LATEX 走起来。一开始环境安装比较麻烦,但是后面的事就省了好多。不用在Word 里面乱折腾,这种方式写书和写代码一样,感觉很愉快,很高大上。

2013 年数据科学这个名词越来越热,新的方法和工具不断在涌现,我们的书稿内容也是一改再改。雏形已经有模有样。这一年大家的生活都有些变化,李舰家庭人口急剧膨胀,达到了惊人的50% 人口增长率。本人作为发展中国家,更是达到了100% 的人口增长率。人口多事情也多了,跑步的速度就慢了下来,一转眼2013 年上海R 会也到了,又要碰见李颖了,但书稿进度还没完,项目延后,心有点虚。

2014 年的时候,李颖已经没有再催稿子了。马拉松还没看到终点,益辉同学的忍者在向我们招手致意。不过,在To-Do List 上面,这份书稿仍昂首排在*个,每天看看它有点内疚,坚持挤出时间弄一点。一转眼夏天快过完了,官网上的R 包增长到了6000 个,我们书稿的页码也慢慢积累到了500 多页。到现在,我终于可以来写这*后的后记。

当做一件事情成为习惯,就容易坚持下去。不论是学东西、写东西还是其他。

肖凯

“R 语言应用系列丛书在2011 年首度面世,至今已经是第5 个年头了。在这期间每年在北京、上海两地的R 会议如火如荼地举办着,并且在2014 年又开辟了更多的新会场,很高兴看到R 语言已经从崭露头角的蓓蕾,跻身为大数据时代倍受追捧的编程软件。在R 语言红得发紫的当下,也听到了林祯舜博士在R 会议上和大家的分享,在R 用户趋于平稳之后,希望与会的各位还会继续关注R。是的,我在心里暗暗对自己说,即便在R 技术成熟之后,作为编辑的我还会多角度深入挖掘它,让它的技术魅力尽情绽放,也会跟进R 的更新以飨读者。

回到这本书上来。这本书是R 系列中非常珍贵的一本,原因在于R 起源发展于国外,国外作品在技术前期具有领先优势,所以我们之前的出版物也多以英译汉作品为主。如今这本原创的书是一个突破,特别是以李舰和肖凯的业界深厚背景为基础,全面阐述了R 语言在数据科学中的发展,许多章节中的内容*次公开了技术细节,我相信这本书会成为一本看得懂、用得上的技术案头书。

如肖凯所述这本书经历了三四年时光,我的真心感受是这不亚于母亲孕育一个孩子,从列提纲、组织内容、具备雏形到正式出版,这个过程中李舰和肖凯倾注了他们大量的心血,牺牲了许多个人的休息时间,李舰回复邮件的时常是深夜,毫不夸张地说我们这个工作小组的邮件加到一起也足够出一本对话语录了。书中许多细微之处渗透着他们的智慧,也展现着他们精益求精、专业的工作态度,比如本书所有的代码在五个操作系统装载*版的R 下经过了严格的测试,所以说很多时候他们是站在读者的角度来想问题,能成为他们的读者是幸运的。在全书付梓之际,*要感谢的是李舰和肖凯这一路的坚持,也让我在编辑过程中学习到了许多知识,同时也感谢吴喜之教授的细心点拨以及对晚辈的关爱,还要感谢在本书出版过程中给予指导帮助的赵丽平编审、周丙常副教授以及出版社的支持,*后感谢我的家人,让我在做妈妈的同时还能静下心来从事我热爱的出版工作。

李颖

前沿

序言

无论从数据科学的角度,从编程语言的角度,还是从应用的角度,这本书是给读者的一个完全意外的礼物。

这本书如此简明,使用最少的文字清楚明白地传达了大量的信息;这本书的内容如此丰富,鲜有包含这样多资源的涉及R 语言的文献;这本书的作者站得高,绝不纠缠那些繁琐而非必要的细节,读者可以很容易地看到问题的全貌和整体结构,而这是获得任何知识的关键;这本书的安排对于性急的人非常方便,若干分钟就可以获得通常几天才能获得的信息。

这本书的成功在于作者的经历:统计计算机软件IT 相关业界。没有这样的背景,不可能对问题驱动的数据科学如此明白,也不可能对软件要素的理解如此清楚,更不可能对众多应用如此轻松地介绍。这本书的成功还在于作者多年的实际经验。实际经验比众多的文凭、奖状、职位等更重要,这本书的写法和内容体现了作者本身能力和知识增长的历程,在实践中获得的知识和能力远非课堂灌输式教学所能比拟的。作者的轻松幽默的心境为这本书画龙点睛,这来自于他们的智慧,使读者能够在一种令人享受的心情下阅读这本书。

这本书使我得到相当的满足和愉快,相信读者也会有同样的感觉。

 

吴喜之

 

前言

僭称科学家我本来是不敢的,不过如今人们对数据的研究和应用的主战场在业界,数据科学家通常指的是一个职位的名称。我的部门现在新招的职位都是Data Scientist”,所以我自称数据科学家应该还好。从我本科进入中国人民大学学习统计学专业开始到现在的10 多年时间里,我所有的求学经历和职业生涯都在和数据打交道,在数据应用的最前线感受到了业界对于数据价值理解的巨大变化。也亲身经历了从数据被冷遇到如今大数据成为显学这一激动人心的变革。这些年的很多经验都化成了这本书中的内容。在这里,我回顾自己在数据科学家道路上的一些经历,用自己的视角来总结这个数据时代的变化,也作为这本书的前言。

我少年时的志向和很多无名的儒生一样,为天地立心,为生民立命,为往圣继绝学,为万世开太平,结果也一样,就是越长大越失望、越难有新的目标,对什么事情都不执着,常被推着走。当然也不会否定自己,习惯顺其自然。就这样不小心走上了数据科学家的道路,在这条路上我经历了很多次对知识和技术的被动接受与主动融合。

 

中间省略两万字,

作者实在有太多肺腑之言,看书吧……

 

最初有写这本书的想法是在2012 年上海R 语言大会时,李颖找到我和肖凯开始谋划一本基于R 语言与数据实战的原创书。当时肖凯提议起名数据科学时我还从来没听说过这个词,没想到短短两年多的时间后,这个词会变得如此火热。当然,从另一面来看,我们这本书居然写了两年多还没写完。当时我还担心数据科学的书名让人摸不着头脑,不过在读了肖凯写的博客和推荐的链接之后,觉得这个词可以非常精确地描述我们的工作。我们从数据出发,介绍各种方法的原理、在R 中的实现以及在具体领域中的应用。书中的内容全部来自于我们平时工作中的经验和对R 语言的感悟,与传统的统计学、R 语言编程或行业实战

类书籍都有所不同,命名数据科学是再合适不过了。

感谢中国人民大学的吴喜之老师,从我当年开始学习R 语言到现在从事专业的数据分析工作,都离不开吴老师悉心的指点,对于本书吴老师也提了很多宝贵的意见,帮助我们改正了不少错误。感谢统计之都的伙伴们,很庆幸有这样一群志趣相投的朋友,大家利用业余时间一同为统计学的普及和应用而努力,平时各类专业问题的讨论和各种各样的八卦是这本书的重要动力和源泉。感谢浙江大学软件学院金融数据分析技术专业2013 级和2014 级的全体同学,我在讲授金融数据分析基础R(语言)及其应用课程的时候用到了本书中大部分的例子,同学们的参与和反馈为本书的不断完善提供了很大的帮助。

关于本书的意见和建议请联系作者的邮箱rinds.book@gmail.com。书籍的相关资源和勘误请参见http://jianl.org/cn/book/rinds.html。欢迎任何的建议和指正!

李舰

数据科学中的R语言(R语言应用系列) pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:数据科学中的R语言(R语言应用系列)