编辑推荐
 ;  ;  ;大数据及其可视化是一门理论性和实践性都很强的课程。本教材针对计算机、信息管理以及其他等相关专业学生的发展需求,系统、全面地介绍了关于大数据及其可视化的技术与应用的基本知识和技能,具有较强的系统性、可读性和实用性。 ;
内容简介
 ;  ;  ;大数据及其可视化是一门理论性和实践性都很强的课程。本书针对计算机、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了关于大数据及其可视化技术的基本知识和技能,详细介绍了大数据与大数据时代、数据可视化之美、Excel 数据可视化方法、Excel 数据可视化应用、大数据的商业规则、大数据激发创造力、大数据预测分析、支撑大数据的技术、数据引导可视化、Tableau 可视化初步、Tableau 数据管理与计算、Tableau 可视化设计、Tableau地图与预测分析和Tableau分享与发布等内容,具有较强的系统性、可读性和实用性。本书适合作为普通高等院校相关专业“大数据基础”“大数据导论”“大数据可视化”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员学习参考。
作者简介
 ;  ; 周苏:浙江大学城市学院教授,专业方向:计算机应用、大数据、创新方法.1988年在天津科学技术出版社出版第一本教材《FoxBASE 及其程序设计技巧》并获1991年全国优秀科技畅销书。1992年所著教材《软件工程及其应用》(天津科技出版社) 获北方十省市科技图书二等奖。至2002年,分别在天津科技出版社、浙江科技出版社、科学出版社等累计出版计算机学术著作、教科书20余本累计千万字。
目录
第1 章大数据与大数据时代............1
1.1 大数据概述.............................3
1.1.1 数据与信息..................3
1.1.2 天文学——信息爆炸
的起源.......................... 3
1.1.3 大数据的定义...............4
1.1.4 用3V 描述大数据
特征............................. 5
1.1.5 大数据的结构类型....... 7
1.2 思维变革之一:样本=总体..... 8
1.2.1 小数据时代的随机
采样............................. 8
1.2.2 大数据与乔布斯的
癌症治疗.................... 11
1.2.3 全数据模式:样本=
总体........................... 12
1.3 思维变革之二:接受数据
的混杂性.............................. 12
1.3.1 允许不精确................12
1.3.2 大数据的简单算法与
小数据的复杂算法..... 13
1.3.3 纷繁的数据越多
越好........................... 14
1.3.4 5%的数字数据与95%
的非结构化数据......... 15
1.4 思维变革之三:数据的
相关关系.............................. 16
1.4.1 关联物,预测的
关键........................... 16
1.4.2 “是什么”,而不是
“为什么”.................. 17
1.4.3 通过相关关系了解
世界........................... 18
【实验与思考】深入理解大数据
时代...................................... 19
第2 章数据可视化之美.................21
2.1 数据与可视化.......................22
2.1.1 数据的可变性.............23
2.1.2 数据的不确定性......... 24
2.1.3 数据的背景信息......... 25
2.1.4 打造最好的可视化
效果........................... 26
2.2 数据与图形...........................26
2.2.1 地图传递信息.............26
2.2.2 数据与走势.................27
2.2.3 视觉信息的科学
解释........................... 28
2.2.4 图片和分享的力量...... 29
2.2.5 公共数据集.................29
2.3 实时可视化...........................31
2.4 可视化分析工具....................31
2.4.1 Microsoft Excel ........... 32
2.4.2 Google Spreadsheets...... 32
2.4.3 Tableau ....................... 33
2.4.4 可视化编程工具......... 33
【实验与思考】熟悉大数据
可视化.................................. 35
第3 章 Excel 数据可视化方法........37
3.1 Excel 的函数与图表..............39
3.1.1 Excel 函数..................40
3.1.2 Excel 图表..................41
大数据及其可视化
2
3.1.3 选择图表类型.............43
3.2 整理数据源...........................44
3.2.1 数据提炼....................44
3.2.2 抽样产生随机数据..... 47
3.3 数理统计中的常见统计量..... 49
3.3.1 比平均值更稳定的
中位数和众数............. 49
3.3.2 正态分布和偏态
分布........................... 50
3.3.3 财务预算中的分析
工具........................... 52
3.4 改变数据形式引起的
图表变化.............................. 53
3.4.1 用负数突出数据的
增长情况.................... 53
3.4.2 重排关键字顺序
使图表更合适............. 54
【实验与思考】体验Excel 数据
可视化方法........................... 55
第4 章 Excel 数据可视化应用........57
4.1 直方图:对比关系................60
4.1.1 以零基线为起点......... 60
4.1.2 垂直直条的宽度要
大于条间距................ 62
4.1.3 慎用三维效果的
柱形图........................ 63
4.1.4 用堆积图表示
百分数........................ 64
4.2 折线图:按时间或类别
显示趋势.............................. 65
4.2.1 减小Y 轴刻度单位
增强数据波动情况..... 65
4.2.2 突出显示折线图中
的数据点.................... 66
4.2.3 通过面积图显示
数据总额.................... 67
4.3 圆饼图:部分占总体的比例.... 68
4.3.1 重视圆饼图扇区的
位置排序.................... 68
4.3.2 分离圆饼图扇区
强调特殊数据............. 69
4.3.3 用半个圆饼图刻画
半期内的数据............. 70
4.3.4 让多个圆饼图对象
重叠展示对比关系..... 71
4.4 散点图:表示分布状态.........72
4.4.1 用平滑线联系散点图
增强图形效果............. 72
4.4.2 将直角坐标改为象限
坐标凸显分布效果..... 73
4.5 侧重点不同的特殊图表.........74
4.5.1 用子弹图显示数据
的优劣........................ 74
4.5.2 用温度计展示工作
进度........................... 75
4.5.3 用漏斗图进行业务
流程的差异分析......... 76
【实验与思考】大数据如何激发
创造力.................................. 78
第5 章大数据的商业规则..............79
5.1 大数据的跨界年度................80
5.2 谷歌的大数据行动................81
5.3 亚马逊的大数据行动............83
5.4 将信息变成一种竞争优势..... 84
5.4.1 数据价格下降,
数据需求上升............. 85
5.4.2 大数据应用程序的
兴起........................... 86
5.4.3 实时响应,大数据
用户的新要求............. 87
5.4.4 企业构建大数据
战略........................... 87
目录
3
5.5 大数据营销...........................88
5.5.1 像媒体公司一样
思考........................... 88
5.5.2 营销面对新的机遇
与挑战........................ 89
5.5.3 自动化营销................90
5.5.4 为营销创建高容量
和高价值的内容......... 91
5.5.5 内容营销....................91
5.5.6 内容创作与众包......... 92
5.5.7 用投资回报率评价
营销效果.................... 93
【实验与思考】大数据营销的
优势与核心内涵................... 93
第6 章大数据激发创造力..............95
6.1 大数据与循证医学................97
6.2 大数据带来的医疗新突破..... 98
6.2.1 量化自我,关注个人
健康........................... 99
6.2.2 可穿戴的个人健康
设备......................... 100
6.2.3 大数据时代的医疗
信息......................... 101
6.3 医疗信息数字化.................103
6.4 搜索:超级大数据的
最佳伙伴............................ 105
6.5 数据决策的成功崛起..........106
6.5.1 数据辅助诊断........... 107
6.5.2 你考虑过……了吗...... 107
6.5.3 大数据分析使数据
决策崛起.................. 108
6.6 大数据帮助改善设计..........109
6.6.1 少而精是设计的
核心..........................110
6.6.2 与玩家共同设计
游戏..........................111
6.6.3 以人为本的汽车
设计理念...................111
6.6.4 寻找最佳音响效果...... 112
6.6.5 建筑数据取代直觉...... 113
【实验与思考】大数据如何激发
创造力................................ 114
第7 章大数据预测分析...............116
7.1 预测分析............................119
7.2 数据情感和情感数据..........122
7.2.1 从博客观察集体
情感......................... 122
7.2.2 预测分析博客中的
情绪......................... 122
7.2.3 影响情绪的重要
因素——金钱........... 124
7.3 数据具有内在预测性..........125
7.4 情感的因果关系..................126
7.4.1 焦虑指数与标普
500 指数...................126
7.4.2 验证情感和被验证
的情感...................... 128
7.4.3 情绪指标影响
金融市场.................. 129
【实验与思考】大数据准备度
自我评分表......................... 130
第8 章支撑大数据的技术............134
8.1 大数据在云端.....................135
8.1.1 云计算概述...............136
8.1.2 云计算的服务形式...... 137
8.1.3 云计算与大数据....... 137
8.1.4 云基础设施...............139
8.2 计算虚拟化.........................140
8.3 网络虚拟化.........................140
8.4 大数据存储.........................141
大数据及其可视化
4
8.4.1 传统存储系统........... 141
8.4.2 大数据时代的
新挑战...................... 142
8.4.3 分布式存储..............143
8.4.4 云存储......................144
8.5 开源技术的商业支援..........145
8.6 大数据的技术架构..............146
8.7 Hadoop 基础.......................147
8.7.1 分布式系统概述....... 147
8.7.2 Hadoop 的由来......... 148
8.7.3 Hadoop 的优势......... 149
8.7.4 Hadoop 的发行
版本......................... 150
8.8 大数据数据处理基础..........150
8.8.1 Hadoop 与NoSQL...... 151
8.8.2 NoSQL 与RDBMS
的主要区别.............. 151
8.8.3 NewSQL ................... 153
【实验与思考】了解大数据的
基础设施............................ 154
第9 章数据引导可视化...............156
9.1 可视化对认知的帮助..........157
9.1.1 七个基本任务........... 157
9.1.2 新的数据研究方法...... 158
9.1.3 信息图形和展示....... 159
9.1.4 走进数据艺术的
世界......................... 160
9.2 可视化设计组件.................161
9.2.1 视觉隐喻..................162
9.2.2 坐标系......................165
9.2.3 标尺..........................167
9.2.4 背景信息..................168
9.2.5 整合可视化组件....... 168
9.3 分类数据的可视化..............169
9.3.1 整体中的部分........... 170
9.3.2 子分类......................170
9.3.3 数据的结构和模式....... 171
9.4 时序数据的可视化..............171
9.4.1 周期..........................172
9.4.2 循环..........................173
9.5 空间数据的可视化..............174
9.6 让可视化设计更清晰..........175
9.6.1 建立视觉层次........... 175
9.6.2 增强图表的可读性....... 176
9.6.3 允许数据点之间
进
前沿
大数据(Big Data)的力量正在积极地影响着社会的方方面面,它冲击着许多主
要的行业,包括零售业、电子商务和金融服务业等,同时,也正在彻底地改变人们的
教育方式、生活方式、工作方式。如今,通过简单、易用的移动应用和基于云端的数
据服务,人们能够追踪自己的行为以及饮食习惯,还能提升个人的健康状况。因此,
有必要真正理解大数据这个极其重要的议题。
中国是大数据最大的潜在市场之一。据估计,中国有近6 亿网民,这就意味着中
国的企业拥有绝佳的机会来更好地了解其客户并提供更个性化的体验,同时,为企业
增加收入并提高利润。阿里巴巴就是一个很好的例子,其不但在商业模式上具有颠覆
性,而且还掌握了与购买行为、产品需求和库存供应相关的海量数据。除了阿里巴巴
高层的领导能力之外,大数据必然是其成功的一个关键因素。
然而,仅有数据是不够的。对于身处大数据时代的企业而言,成功的关键还在于
找出大数据所隐含的真知灼见。“以前,人们总说信息就是力量,但如今,对数据进
行分析、利用和挖掘才是力量之所在。”
很多年前,人们就开始对数据进行利用。例如,航空公司利用数据为机票定价,
银行利用数据搞清楚贷款对象,信用卡公司则利用数据侦破信用卡诈骗等。但直到最
近,数据才真正成为人们日常生活的一部分。随着谷歌(Google)以及QQ、微信、
淘宝等的出现,大数据游戏被永远改变了。你和我,或者任何一个享受这些服务的用
户都生成了一条数据足迹,它能够反映出人们的行为。每次进行搜索时,如查找某个
人或者访问某个网站,都加深了这条足迹。互联网企业开始创建新技术来存储、分析
激增的数据——结果就迎来了被称为“大数据”的创新爆炸。
进入2012 年以来,由于互联网和信息行业的快速发展,大数据越来越引起人们
的关注,已经引发云计算、互联网之后IT 行业的又一大颠覆性的技术革命。人们用
大数据来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创
新。云计算主要为数据资产提供保管、访问的场所和渠道,而数据才是真正有价值的
资产。企业内部的经营信息、互联网世界中的商品物流信息,互联网世界中的人与人
交互信息、位置信息等,其数量将远远超越现有企业IT 架构和基础设施的承载能力,
实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治理、
企业决策乃至个人生活服务,是大数据的核心议题,也是云计算内在的灵魂和必然的
升级方向。
对于在校大学生来说,大数据及其可视化的理念、技术与应用是一门理论性和实
践性都很强的“必修”课程。在长期的教学实践中,我们体会到坚持“因材施教”的
重要原则,把实践环节与理论教学相融合,抓实践教学促进理论知识的学习,是有效
改善教学效果和提高教学水平的重要方法之一。本书的主要特色是:理论联系实际,
结合一系列了解和熟悉大数据理念、技术与应用的学习和实践活动,把大数据及其可
视化的相关概念、基础知识和技术技巧融入实践中,使学生保持浓厚的学习热情,加
深对大数据技术的兴趣、认识、理解和掌握。
本书系统、全面地介绍了大数据及其可视化的基本知识和应用技能,详细介绍了
大数据与大数据时代、数据可视化之美、Excel 数据可视化方法、Excel 数据可视化应
用、大数据的商业规则、大数据激发创造力、大数据预测分析、支撑大数据的技术、
数据引导可视化、Tableau 可视化初步、Tableau 数据管理与计算、Tableau 可视化设
计、Tableau 地图与预测分析,以及Tableau 分享与发布等内容,具有较强的系统性、
可读性和实用性。
本课程的教学评测可以从这样几个方面入手,即:
(1)每章课前【案例导读】(14 次)。
(2)每章课后【实验与思考】(14 次)。
(3)课程设计(附录)。
(4)课程实验总结(附录)。
(5)结合平时考勤。
(6)任课老师认为必要的其他考核方法。
与本书配套的教学PPT 课件等文档可从中国铁道出版社教学资源网站(www.tdpress.
com51eds) 的下载区下载,欢迎教师与作者交流并索取为本书教学配套的相关资料并交
流:zhousu@qq.com,QQ:81505050,个人博客:http://blog.sina.com.cn/zhousu58。
本书由周苏、王文等编著,并得到浙江大学城市学院、浙江商业职业技术学院、
温州安防职业技术学院等多所院校师生的支持,王硕苹、张丽娜、张健、吴林华等参
与了本书的部分编写工作,在此一并表示感谢!
由于编者水平有限,加之时间仓促,书中难免存在疏漏和不足之处,恳请读者批
评指正。
周苏
2016 年初夏于西子湖畔
大数据及其可视化 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版