欢迎光临
免费的PDF电子书下载网站

大数据: 战略 技术 实践 PDF下载

编辑推荐

  (1)全面剖析当前大数据领域中的主流技术,并配以行业应用实例和一线研发人员的独到见解。
  (2)配置精美彩插,多视角完美展现大数据的力量。
  (3)学界知名专家、企业领袖 联袂作序推荐。

 ;

内容简介

  本书从实际技术解决方案出发,提出了大数据技术四层架构,即基础设施层、管理层、分析层、应用层。在此基础上,全面剖析了当前大数据领域中的主流技术,并配以行业应用实例和一线研发人员的独到见解。力求使读者能够通过阅读此书,全面了解当前大数据技术动态和发展趋势,并可针对自己面临的大数据问题找到可行的解决方案。

作者简介

  本书编写组来自于EMC中国研究院和Vmware中国研发团队,他们将亲历的丰富的大数据分析处理研究成果和企业大数据实施经验,带到本书中,使得本书在技术的广度与深度方面得到很好地配合。

大数据: 战略 技术 实践 PDF下载

目录


 
第一部分 大数据技术概览
第1章 概述
1.1 什么是大数据
1.1.1 大数据的定义及特征
1.1.2 大数据结构类型
1.1.3 大数据实例
1.2 大数据发展史
1.3 大数据技术架构
1.4 机遇与挑战
参考文献
第2章 大数据应用
2.1 大数据驱动新应用
2.1.1 大数据生态系统
2.1.2 新的业务应用
2.2 行业应用实例
2.2.1 奥巴马的大数据
2.2.2 预测犯罪
2.2.3 数据让游戏更精彩
2.2.4 智能交通
2.2.5 大学教育
2.2.6 大数据的姻缘
2.2.7 传媒出版
参考文献
第3章 大数据基础设施
3.1 云端大数据
3.1.1 云基础设施
3.1.2 虚拟化的三驾马车
3.1.3 云安全和云平台
3.2 计算虚拟化
3.2.1 基本概念
3.2.2 从部分虚拟化到全虚拟化
3.2.3 处理器(CPU)的虚拟化
3.2.4 内存(Memory)的虚拟化
3.3 大数据存储
3.3.1 传统存储系统时代的简单回顾
3.3.2 大数据时代的新挑战
3.3.3 分布式存储及其案例
3.3.4 云存储及其存储虚拟化
3.3.5 大数据存储的其他需求及其特点
3.4 网络虚拟化
3.4.1 网卡虚拟化
3.4.2 虚拟交换机(Virtual Switch)
3.4.3 接入层的虚拟化
3.4.4 覆盖网络虚拟化(NetworkVirtualization Overlay)
3.4.5 软件定义的网络(SDN)
3.4.6 对大数据处理的意义
3.5 基础架构的安全:云环境中面临的新的安全挑战
3.5.1 计算资源方面的安全和挑战
3.5.2 存储方面的安全和挑战
3.5.3 网络方面的安全和挑战
3.6 大数据时代的云服务
3.6.1 大数据与基础设施即服务
3.6.2 亚马逊云计算服务的解决方案
3.6.3 OpenStack解决方案
3.6.4 大数据与应用平台即服务
参考文献
第4章 大数据管理
4.1 大数据事务处理(OLTP)
4.1.1 NoSQL
4.1.2 NewSQL
4.2 大数据分析处理(OLAP)
4.2.1 分布式大规模批量处理(MapReduce / Hadoop)
4.2.2 MPP数据库
4.3 流数据管理
4.3.1 流数据管理简介
4.3.2 复杂事件处理简介
4.3.3 复杂事件处理软件Esper介绍
4.3.4 大数据流处理
4.3.5 大数据摄取与处理
参考文献
第5章 大数据分析
5.1 数据分析的演变与现状
5.1.1 数据分析的商业驱动力
5.1.2 面向分析的数据环境的演变
5.1.3 传统分析架构
5.2 大数据分析平台
5.2.1 大数据分析平台的要点
5.2.2 大数据分析平台实例:Cetas
5.3 高级分析理论与方法
5.3.1 聚类分析
5.3.2 关联规则
5.3.3 回归和分类预测
5.4 数据可视化
5.4.1 数据可视化基础
5.4.2 用数据讲故事
5.4.3 数据可视化的模式
5.4.4 数据可视化工具基础
5.4.5 大数据的可视化
参考文献
第6章 数据科学与数据科学家
6.1 商业智能vs数据科学
6.2 数据科学家
6.2.1 大数据生态系统中的关键角色
6.2.2 数据科学家的特质
6.3 数据分析生命周期模型
6.3.1 模型概述
6.3.2 阶段1:探索发现
6.3.3 阶段2:数据准备
6.3.4 阶段3:模型规划
6.3.5 阶段4:模型建造
6.3.6 阶段5:沟通结果
6.3.7 阶段6:项目实施
6.4 使用范例:企业创新分析
6.4.1 阶段1:探索发现
6.4.2 阶段2:数据准备
6.4.3 阶段3:模型规划
6.4.4 阶段4:模型建造
6.4.5 阶段5:沟通结果
6.4.6 阶段6:项目实施
参考文献
第二部分 大数据解决方案范例
第7章 医疗大数据解决方案
7.1 医疗信息化
7.1.1 全球医疗信息化历史回顾
7.1.2 我国医疗信息化发展趋势
7.2 医疗数据综述
7.2.1 医疗数据的大数据特性
7.2.2 医疗大数据挑战和机遇
7.3 医疗大数据基础架构
7.3.1 建设原则
7.3.2 面向医疗大数据的信息基础架构方案
7.4 医疗大数据分析
7.4.1 医疗云的兴起
7.4.2 医疗云上的大数据
7.4.3 医疗大数据分析解决方案
7.5 医疗大数据的展望
参考文献
第8章 物联网大数据解决方案
8.1 物联网
8.1.1 物联网的概念
8.1.2 物联网技术
8.1.3 物联网数据
8.1.4 物联网的机遇和挑战
8.1.5 物联网应用实例
8.2 应用行业背景
8.2.1 脱硫系统的必要性
8.2.2 脱硫系统工作原理
8.2.3 大数据时代的数据挖掘
8.3 参数分析
8.3.1 火电厂的大数据
8.3.2 脱硫相关参数
8.4 优化目标
8.4.1 脱硫参数优化
8.4.2 目标成本优化
8.5 优化方法
8.5.1 基于数据的理论与方法
8.5.2 最优化脱硫系统可调参数
8.5.3 最小化脱硫系统成本
8.6 数据相关问题
8.6.1 主要监控参数
8.6.2 业务相关假设
8.6.3 数据中存在的问题
8.7 优化目标1: 脱硫运行参数最优目标值挖掘
8.7.1 数据分布直方图
8.7.2 基于历史数据的工况划分
8.7.3 FCM与模糊关联规则挖掘最优可调参数
8.8 优化目标2: 最优目标成本计算
8.8.1 增压风机用电成本估计
8.8.2 石灰石成本函数
8.9 实现简介
8.9.1 基于HBase的数据模型
8.9.2 对Mahout的改进
8.1 总结
参考文献
第9章 移动平台大数据解决方案
9.1 移动平台的大数据挑战
9.2 Instagram案例研究
9.2.1 面临的挑战
9.2.2 解决方案
9.3 Mobile Back-end as a Service基础
9.4 MBaaS提供商案例研究
9.5 基于PaaS的MBaaS大数据解决方案
参考文献
第10章 社交网站大数据解决方案
10.1 大数据时代社交网站面临的挑战
10.2 Twitter解决方案
10.2.1 Twitter在线部分大数据解决方案
10.2.2 Twitter离线部分大数据解决方案
10.3 LinkedIn解决方案
10.4 Facebook解决方案
10.5 国内社交网络解决方案
10.5.1 腾讯大数据解决方案
10.5.2 新浪微博大数据解决方案
参考文献
第11章 大数据未来展望
11.1 大数据发展趋势
11.2 新的机遇与挑战
参考文献

媒体评论

  我认为本书适合多种类型的读者,包括想对大数据有大概了解的,想了解大数据系统和软件应用的,想学习大数据基本概念和方法的,以及想通过大数据提高企业生产力的。这些读者都能够受益于本书。我欣赏本书的写法和很多内容,希望你们也会喜欢。
  ——李凯 博士
  美国普林斯顿大学计算机科学系 Paul and Marcia Wythes 讲席教授
  美国国家工程院院士
  ACM院士、IEEE院士

  大数据时代已经来临,但在国内能系统阐述大数据的书却不多。此次编委会把EMC中国研究院和业界的大数据专业人才汇聚起来,撰写这本关于大数据技术、管理、分析和应用的书,非常及时。EMC是全球领先的存储及管理技术和产品提供商,VMware是全球领先的虚拟化技术和产品提供商,也是开源Cloud Foundry云平台的贡献者和开源Redis存储系统的赞助者,编写组成员在这两家公司的经验,将会给读者带来他们在大数据技术和实际应用中深刻和独到的见解。
  ——刘强东
  京东商城董事局主席兼首席执行官

免费在线读

  1.4机遇与挑战
  大数据对当今企业而言,既是绝佳的商机,也是巨大的挑战。
  当今企业发展的速度及数字世界所创造的海量数据,要求采用新方法来从数据中提取价值[81;在结构化和非结构化数据流背后,蕴藏着一些问题的答案。但是企业甚至都没有想到问这些0题,或者由于技术限制尚未能提问这些问题。大数据迫使企业寻找接近数据的新方式一~找}其中蕴藏着什么以及如何加以利用。存储、网络和计算技术领域的最新发展使得企业能经济、高效地利用大数据并将其转变为业务优势的有力来源。
  ForresterResearch估计企业仅有效利用了不到5%的可用数据。这是因为要处理其余数据干价不菲。大数据技术和方法是一项重要进步,因为它们使得企业能经济高效地处理目前被忽奉的那95%的数据。想想优点:如果两家公司以相同的效率利用数据,但其中一家处理l5%的蓥据,而另一家只能处理5%,哪家公司更有可能胜出?企业若能发掘大数据来改善战略和执干能力,也就代表他们正在拉开与竞争者的优势距离。
  如果使用正确,大数据可以带来洞察力,从而制订、改善和重导业务计划;发现运营路障简化供应链;更好地理解客户;开发新产品、服务和业务模式。尽管对大数据的有用性有了};晰的认识,但通往大数据生产率的道路仍不明确。成功利用大数据洞察力要求在成熟技术、亳式工作人员技能和领导力重心方面具有实际投入。
  领先企业直觉地嗅到了大数据蕴藏的商业价值,并清楚认识到必须加快将大数据进化成超越传统意义的商业智能,方法就是在每个决策核心应用数据分析。
  以消费品生产和零售业为例【201,从20世纪70年代到80年代早期,包装消费品生产商和零售商们在经营业务时会参考ACNielsen半月刊市场报告。这些报告提供了竞争对手和市场数据(如收入、销售量、平均价格和市场份额等),生产商们借此来确定销售、营销、广告和促销战略、计划,以及与渠道合作伙伴(如分销商、批发商和零售商)相关的开支。到20世纪80年代中期,InformationResourceslnc.(IRI)推行在零售地点安装免费的销售点扫描器,俗称“POS机”,以交换其中的销售数据。零售商们愉快地接受了这样的交换,因为劳动力是他们的最大成本构成,而且那时对POS机数据的价值认识很有限。这种在当时被视为“大数据”的POS机数据改变了游戏规则、行业内的权力转变(在生产商和销售商之间)以及经营业务方式。数据量从MB扶摇直上到TB级,催生了新一代存储和服务器平台,以及各种分析工具。沃尔玛等前沿公司利用这种新的“大数据”和新的分析平台与工具获得了竞争优势。这些公司率先开发了新类别的大数据、分析驱动型业务应用程序,以一种具有成本效益的方式解决了之前不能如1比解决的业务问题,例如基于需求的预测、供应链优化、交易支出有效性、市场购物篮分析、分类管理和商品阵列、价格/收益优化、商品减价管理、客户忠诚度计划等。30年后,一切似乎又回到了从前。对新的、低延迟、细粒度、多样化数据源(“大数据,,)的开发具有改变企业和行业运营方式的潜力。这些新的数据源来自于一系列设备、客户交互和业务活动,能揭示对企业和行业价值链的深刻见解。
  ……P15

大数据: 战略 技术 实践 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:大数据: 战略 技术 实践