欢迎光临
免费的PDF电子书下载网站

大数据浪潮——大数据整体解决方案及关键技术探索 PDF下载

编辑推荐

暂无

内容简介

  本书站在大数据学科发展前沿和大数据产业发展方向上,结合学术界和工业界的研究成果和实践经验,传播大数据领域的研究动态和先进技术。

  全书通过“基础、进阶、实战、应用”四个篇章,既深入浅出地介绍大数据的基本概念,又面面俱到地剖析了大数据整体解决方案所涉及的具体技术细节。

  本书既适合初学者作为基础学习资料,又适合科研人员作为理论研究教程,更适合从业人员作为技术参考书目。


作者简介

  陈敏,男,1980年12月出生,教授,博士生导师,华中科技大学嵌入与普适计算实验室主任,23岁获华南理工大学通信与信息系统博士学位。发表学术论文180余篇,其中包括SCI论文90余篇,IEEE/ACM期刊论文40余篇;相关论文在美国科技信息索引SCI 数据库中他引总数500次,Google Scholar中引用总数超过4250次,单篇论文引用超高520次,其中十篇第一作者论著引用次数超过1800次,H-index = 29;曾获第五届国际异构网服务质量大会QShine 2008*论文奖和IEEE ICC 2012*论文奖。2012年入选国家第二批“青年千人计划”,长期从事普适计算、移动通信、多媒体通信、传感网、云计算、远程医疗等领域的研究工作,担任Information Science等7个国际SCI学术期刊的副编辑或编委,以及IEEE Wireless Communications及IEEE Network等多个著名国际杂志及期刊的特邀编辑。任IEEE CIT 2012,TRIDENTCOM 2014,Mobimedia 2015等国际学术大会副总主席,任Cloudcomp 2014/2015大会指导委员会成员。陈敏教授具有多年海外工作经验,曾在韩国国立汉城大学、加拿大不列颠哥伦比亚大学从事博士后研究,曾任韩国首尔大学助理教授。1999年入选国际电子电气工程师学会(IEEE)高级会员,2014年担任IEEE计算机协会大数据技术委员会主席。入选爱思唯尔2014年中国高被引学者。

大数据浪潮——大数据整体解决方案及关键技术探索 PDF下载

目录

1 大数据背景
 ; 1.1 大数据时代的到来
 ; 1.2 大数据定义及特征
 ; 1.3 大数据价值
 ; 1.4 大数据备受关注
 ; 1.5 大数据带来的挑战
2 大数据基础
 ; 2.1 云计算
 ; ; ; 2.1.1 云计算概述
 ; ; ; 2.1.2 云计算与大数据的联系
 ; 2.2 物联网
 ; ; ; 2.2.1 物联网概述
 ; ; ; 2.2.2 物联网与大数据
 ; 2.3 数据中心
 ; ; ; 2.3.1 数据中心概述
 ; ; ; 2.3.2 数据中心与大数据
3 大数据的生成和采集
 ; 3.1 大数据生成
 ; ; ; 3.1.1 企业内部数据
 ; ; ; 3.1.2 物联网数据
 ; ; ; 3.1.3 互联网数据
 ; ; ; 3.1.4 生物医疗数据
 ; ; ; 3.1.5 其他科学数据
 ; 3.2 大数据采集
 ; ; ; 3.2.1 数据收集
 ; ; ; 3.2.2 数据传输
 ; ; ; 3.2.3 数据预处理
4 大数据存储
 ; 4.1 海量存储系统
 ; 4.2 分布式存储系统
 ; 4.3 大数据存储机制
 ; ; ; 4.3.1 数据库技术
 ; ; ; 4.3.2 数据库编程模型
5 大数据分析
 ; 5.1 传统数据分析方法
 ; 5.2 大数据分析方法
 ; 5.3 大数据分析架构
 ; 5.4 大数据挖掘和分析软件
6 大数据浪潮——大数据整体解决方案及关键技术探索目录6大数据整体解决方案
 ; 6.1 大数据解决方案方法论
 ; ; ; 6.1.1 大数据解决方案参考模型
 ; ; ; 6.1.2 大数据解决方案分类
 ; 6.2 大数据硬件平台
 ; ; ; 6.2.1 可扩展性设计
 ; ; ; 6.2.2 可定制性设计
 ; 6.3 大数据软件系统
 ; ; ; 6.3.1 大数据处理系统核心模块
 ; ; ; 6.3.2 发行版增强功能、企业应用优化和增值服务
 ; ; ; 6.3.3 基于内存计算的大数据处理系统
 ; 6.4 大数据典型处理流程
 ; 6.5 大数据一体化解决方案比较
7 分布式文件系统
 ; 7.1 ; /操作
 ; ; ; 7.1.1 /操作中的数据检查
 ; ; ; 7.1.2 数据的压缩
 ;   7.1.3 数据的/中序列化操作
  7.2 文件系统
  7.3 体系结构
    7.3.1 的特点和局限
    7.3.2 相关概念
    7.3.3 架构
  7.4  文件结构
    7.4.1 的文件结构
    7.4.2 编辑日志 及文件系统映像
    7.4.3  的目录结构
    7.4.4 的目录结构
  7.5 读/写数据流
    7.5.1 文件的读取
    7.5.2 文件的写入
    7.5.3 一致性模型
  7.6 命令详解
    7.6.1 通过进行并行复制
    7.6.2 平衡
    7.6.3 其他命令
8 并行编程模型
  8.1 体系结构
    8.1.1 基本模型
    8.1.2 作业执行流程
  8.2 关键流程详解
    8.2.1 过程
    8.2.2 过程
    8.2.3 过程
  8.3 高级应用
    8.3.1 二次排序
    8.3.2 全排序
    8.3.3 分布式缓存
    8.3.4  小文件处理与文件压缩
    8.3.5 负载均衡
9 数据库
  9.1 体系结构
  9.2 的设计与数据访问
  9.3 过滤器
    9.3.1 比较过滤器
    9.3.2 专用过滤器
    9.3.3 附加过滤器
   
    9.3.5 自定义过滤器
  9.4 多维数据访问
    9.4.1 通过实现
    9.4.2 通过设计实现
  9.5 协处理器
    9.5.1 类
    9.5.2 协处理器的加载
    9.5.3 观察者
    9.5.4 终端
  9.6 二级索引
    9.6.1 全局索引( )
    9.6.2 本地索引( )
10 交互式查询语言
  10.1 体系结构
    10.1.1 客户端
    1
  10.2 数据类型
    10.2.1 基本类型
    10.2.2 复杂类型
  10.3 存储方式和压缩类型
    10.3.1 托管表和外部表
    10.3.2 存储方式
  10.4 关键技术
    10.4.1 简介
    10.4.2 表的创建
    10.4.3 表的数据加载
    10.4.4 表的查询
    10.4.5 表的更改
    10.4.6 表的删除
    10.4.7 表的分区
    10.4.8 表的分桶
    10.4.9 用户定义函数
  10.5 优化技术
    10.5.1 优化
    10.5.2 数据倾斜优化
    10.5.3 和个数控制
11 资源管理和调度框架——
  11.1 1架构面临的问题
  11.2 架构
    11.2.1 整体架构
    11.2.2 组件的作用
    11.2.3 组件的作用
    11.2.4 组件的作用
    11.2.5 运行在上的计算框架
    11.2.6 在上定制计算框架
  11.3 管理后台简介
  11.4 资源调度
12 内存计算引擎
  12.1 简介
    12.2 整体架构
    12.3 核心概念
    12.3.1 弹性分布式数据集
    12.3.2 模型的优点
    12
  12.4 编程模型
    12.4.1 初始化
    1
    12
  12.5 相关组件
  12.6 应用实例
    12
    12
    12.6
13 大数据应用
  13.1 大数据应用演化
  13.2 大数据分析的关键领域
    13.2.1 结构化数据分析
    13.2.2 文本分析
    13.2.3 分析
    13.2.4 多媒体分析
    13.2.5 网络分析
    13.2.6 移动分析
14 大数据案例分析
  14.1 物联网大数据
    14.1.1 物联网大数据的表示
    14.1.2 物联网大数据的预处理
    14.1.3 物联网大数据的快速处理
    14.1.4 物联网大数据的并行分析
    14.1.5 物联网大数据处理平台的搭建
    14.2 其他大数据的典型应用
    14.2.1 企业级应用
    14.2.2 社交网络大数据
    14.2.3 医疗健康
    14.2.4 群智感知
    14.2.5 智能电网
15 总结
  15.1 大数据的研究热点及研究方向
    15.1.1 基础理论研究
    15.1.2 关键技术研究
    15.1.3 应用实践研究
    15.1.4 数据安全研究
  15.2 展望
  参考文献

 

前沿

  前言步入21世纪以来,各领域的数据都呈现爆炸式的增长,对数据的管理和分析已成为人类面临的巨大的挑战。如今,工业界、研究界甚至政府部门都对大数据这一研究领域产生了巨大的兴趣。《自然》、《科学》等国际知名杂志也分别开设了专栏,用来讨论大数据带来的挑战和重要性。在过去的几年中,几乎所有主要的工业公司,其中包括EMC、甲骨文(Oracle)、IBM、微软、谷歌、亚马逊和Facebook等,都开始发展自己的大数据项目。随着大数据产业的蓬勃发展,数据已经成为可以与物质资产和人力资本相提并论的重要的生产要素,创造着巨大的社会和经济价值。在我国政府发布的“十二五”规划中,信息处理技术作为四项关键技术创新工程之一被不断提出,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这些都是大数据的重要组成部分。而另外三项关键技术创新工程,包括信息感知技术、信息传输技术、信息安全技术,也都与大数据密切相关。在科技部发布的《“十二五”国家科技计划信息技术领域2013年度备选项目征集指南》中的“先进计算”板块已明确提出,重点发展“面向大数据的先进存储结构及关键技术”。在“十二五”收官之际,本书通过“基础、进阶、实战、应用”四个篇章共十五个章节,全面总结了过去五年中在大数据领域涌现的关键技术和典型应用,回顾大数据在我国从概念走向实践的发展历程,激励更多人才参与发展大数据这一国家战略中来,促进数据资源成为带动我国经济增长的新的要素。本书是国内第一本产学研合作,介绍大数据研究热点和技术难点的图书,它全方位解读了该领域的现状、趋势及挑战。本书详细介绍了大数据的生命周期、关键技术及应用领域,并突出强调了大数据整体解决方案的重要性。无论传统的数据仓库技术,还是新兴的分布式处理技术等方案都有特定的短板,无法满足大数据对于基础设施扩展性,数据处理个性化、多样性和一体化等方面的需求。因此,本书总结工业界和学术界多年实践经验,结合互联网、开源社区和大数据厂商多年的研究成果,融入作者对大数据的理解和分析,提出大数据解决方案参考模型,填补大数据领域目前尚未形成完善标准体系这一技术空白。本书内容由笔者多年的研究工作整理而成!在成书的过程中得到华中科技大学出版社王红梅编辑的大力支持,在此表示诚挚的感谢。本书在编写过程中广泛参考了许多专家、学者的文章、著作以及相关技术文献。笔者在此一并表示衷心感谢。由于水平有限,书中存在缺点、错误在所难免。恳请广大读者批评指正。

大数据浪潮——大数据整体解决方案及关键技术探索 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:大数据浪潮——大数据整体解决方案及关键技术探索