编辑推荐
数据科学方面的书籍玲琅满目,大多数都在介绍如何使用各种全新的工具和技术,鲜有讨论数据科学中细致入微的解决问题的过程。本书作者结合自己的亲身经历,讲述了数据科学中从项目准备、解决方案构建到项目交付的全部过程,并以案例的形势深入浅出地讲解在开展数据科学项目的过程中可能遇到的各种问题,可以帮助你按图索骥地学会数据科学。本书不会过多地纠结于细节的技术,而是更注重思维方式的梳理,以及对数据科学的深刻洞察,帮助你明晰要解决的问题,并找到实际解决方案。
如果你想了解数据科学,走进数据科学,甚至成为该领域的王者,那么本书将是你的完美参考。
 ;
内容简介
作者布瑞恩·戈德西结合自己的亲身经历,讲述了数据科学从项目准备、解决方案构建到项目交付的全部过程,并以案例的形式深入浅出地讲解了在开展数据科学项目的过程中可能遇到的各种问题,循序渐进地教你解决现实世界中以数据为中心的问题。在阅读本书时,你会发现或掌握有价值的统计技术,并探索强大的数据科学软件。更重要的是,你将使用结构化的数据过程来集成这些知识。完成了这个过程,你便为终身学习和实践数据科学奠定了坚实的基础。
全书分为三部分,分别代表数据科学过程的三个主要阶段。*部分讨论准备工作,强调在项目开始时投入时间和精力去收集信息以避免后期的头疼问题。第二部分讨论把计划付诸于行动,利用从*部分了解到的知识,以及统计学和软件可以提供的所有工具,为客户构建产品。第三部分讨论项目的完成,包括交付、反馈、修改、支持及干净收尾。
 ;
作者简介
作者简介
布瑞恩·戈德西(Brian Godsey) 在加入以数据为中心的初创企业之前,布瑞恩·戈德西博士在学术界和政府机构有近十年的工作经验,曾经把数学和统计学应用到诸如生物信息、金融和国防等领域。他还在巴尔的摩领导过当地的一家数据创业公司,并伴随着企业从种子基金成长到A轮融资,亲眼目睹产品从原型发展到生产版本,此前他曾在Unoceros和Panopticon实验室两家初创公司任职,帮助它们推出了以数据为中心的产品。
译者简介
陈斌(Chuck Chen) 现任易宝CTO。1989年获得吉林大学硕士学位;1992年任新加坡航空公司高级系统分析师;1999年投身于硅谷互联网技术发展浪潮,曾任日立美国系统集成总监,Abacus首席架构师和Nokia美国首席工程师;2008年任eBay资深架构师,负责移动应用的架构设计。丰富的海外经历,多年的架构经验,深谙移动互联网对传统行业的影响;2014年再次投身易宝,提出大、平、移、商的战略方针,全力推动移动互联网技术,引导行业变革。
目录
目 录
本书赞誉
中文版序一
中文版序二
译者序
前言
致谢
关于本书
关于原书封面插图
第一部分 准备和收集数据与知识
第1章 数据科学的逻辑 …… 2
1.1 数据科学与本书 …… 4
1.2 意识的可贵 …… 7
1.3 研发人员与数据科学家 …… 9
1.4 需要成为软件研发者吗 …… 12
1.5 需要明白统计学吗 …… 13
1.6 优先级:知识、技术、观点 …… 14
1.7 最佳实践 …… 17
1.8 阅读本书:我怎么讨论概念 …… 23
小结 …… 24
第2章 通过好的提问设置目标 …… 26
2.1聆听客户 …… 27
2.2提出关于数据的好问题 …… 37
2.3用数据回答问题 …… 42
2.4设定目标 …… 48
2.5计划要有弹性 …… 50
练习 …… 51
小结 …… 51
第3章 周围的数据:虚拟的荒野 …… 52
3.1数据作为研究对象 …… 52
3.2数据可能存在的地方,以及如何与之交互 …… 62
3.3数据侦察 …… 80
3.4案例:microRNA与基因表达 …… 89
练习 …… 94
小结 …… 95
第4章 数据整理:从捕捉到驯化 …… 96
4.1案例研究:最佳田径表演 …… 97
4.2准备整理数据 …… 101
4.3技巧与工具 …… 109
4.4常见的陷阱 …… 112
练习 …… 119
小结 …… 119
第5章 数据评估:动手检查 …… 120
5.1案例:安然的电子邮件数据 …… 121
5.2描述性统计 …… 123
5.3检查数据的假设 …… 130
5.4寻找特定的实体 …… 134
5.5大概的统计分析 …… 140
练习 …… 147
小结 …… 147
第二部分 构建软件和统计产品
第6章 制订计划 …… 150
6.1学到了什么 …… 152
6.2重新考虑期望和目标 …… 158
6.3规划 …… 164
6.4沟通新目标 …… 175
练习 …… 176
小结 …… 177
第7章 统计建模:概念与基础 …… 178
7.1如何看待统计 …… 179
7.2统计学:与数据科学相关的领域 …… 180
7.3数学 …… 184
7.4统计模型与推理 …… 194
7.5其他的统计方法 …… 218
练习 …… 227
小结 …… 227
第8章 软件:统计学在行动 …… 229
8.1电子表格和用户图形界面应用 …… 230
8.2编程 …… 239
8.3选择统计软件工具 …… 264
8.4把统计转换成软件 …… 271
练习 …… 277
小结 …… 278
第9章 辅助软件:更大、更快、更高效 …… 279
9.1数据库 …… 280
9.2高性能计算 …… 287
9.3云服务 …… 290
9.4大数据技术 …… 293
9.5XX即服务 …… 297
练习 …… 298
小结 …… 298
第10章 执行计划:汇总 …… 299
10.1执行计划的诀窍 …… 300
10.2修改计划 …… 308
10.3结果:知道什么时候足够好 …… 310
10.4案例研究:基因活性测定协议 …… 315
练习 …… 328
小结 …… 329
第三部分 整理产品结束项目
第11章 交付产品 …… 332
11.1了解客户 …… 333
11.2交付形式 …… 335
11.3内容 …… 345
11.4案例:分析电子游戏 …… 351
练习 …… 353
小结 …… 353
第12章 交付后:问题与修改 …… 354
12.1产品及其使用问题 …… 354
12.2反馈 …… 364
12.3产品修改 …… 370
练习 …… 377
小结 …… 378
第13章 结束:项目善后 …… 379
13.1项目善后 …… 380
13.2从项目中学习 …… 392
13.3展望未来 …… 396
练习 …… 398
小结 …… 399
练习:案例与答案 …… 400
 ;
数据即未来:大数据王者之道 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版