编辑推荐
《R与Hadoop大数据分析实战》是首部全面讲解R语言与Hadoop技术结合应用于大数据分析的优秀著作;
系统阐释R与Hadoop集成的各种实用方法、工具和**实践,深入剖析各种常见问题,包含大量实例,能为用户高效利用R语言与Hadoop技术进行大数据分析提供翔实指导。
 ;
内容简介
《R与Hadoop大数据分析实战》全面而系统地讲解了如何将R语言与Hadoop技术结合并应用于大数据分析,不仅系统且深入地阐释了R与Hadoop集成技术的工具、方法、原则和*实践,而且通过大量实践案例深入剖析各种常见问题,能为用户高效利用R语言与Hadoop技术进行大数据分析提供翔实指导。
《R与Hadoop大数据分析实战》分为四部分,共7章:第一部分(第1~2章)是基础知识,主要讲解R语言以及Hadoop的安装过程、计算原理和基本概念;第二部分(第3~4章)是初级应用,主要讲解RHIPE、RHadoop和Hadoop Streaming三种实现方案;第三部分(第5~6章)是高级实例,主要以RHadoop为技术背景,讲解多个实际应用案例;第四部分(第7章)是数据库连接,主要讲解在RHadoop下如何与各类数据库进行连接。
作者简介
目录
译者序
前言
审校者简介
致谢
第1章 R和Hadoop入门
1.1 安装
1.2 安装R
1.3 R语言的功能特征
1.3.1 使用R程序包
1.3.2 执行数据操作
1.3.3 日渐增多的社区支持
1.3.4 R语言数据建模
1.4 Hadoop的安装
1.4.1 不同的Hadoop模式
1.4.2 Hadoop的安装步骤
1.5 Hadoop的特点
1.5.1 HDFS简介
1.5.2 MapReduce简介
1.6 HDFS和MapReduce架构
1.6.1 HDFS架构
1.6.2 MapReduce架构
1.6.3 通过图示了解HDFS和MapReduce架构
1.7 Hadoop的子项目
1.8 小结
第2章 编写Hadoop MapReduce程序
2.1 MapReduce基础概念
2.2 Hadoop MapReduce技术简介
2.2.1 MapReduce中包含的实体
2.2.2 MapReduce中的主要执行进程
2.2.3 MapReduce的局限
2.2.4 MapReduce 可以解决的问题
2.2.5 使用Hadoop编程时用到不同的Java概念
2.3 Hadoop MapReduce原理
2.3.1 MapReduce对象
2.3.2 MapReduce中实现Map阶段的执行单元数目
2.3.3 MapReduce中实现Reduce阶段的执行单元数目
2.3.4 MapReduce的数据流
2.3.5 深入理解HadoopMapR
2.4 编写Hadoop MapReduce示例程序
2.4.1 MapReduce job运行的步骤
2.4.2 MapReduce可解决的商业问题
2.5 在R环境中编写Hadoop MapReduce程序的方式
2.5.1 RHadoop
2.5.2 RHIPE
2.5.3 Hadoop streaming
2.6 小结
第3章 集成R和H
3.1 RHIPE
3.1.1 安装
3.1.2 RHIPE架构
3.1.3 RHIPE实例
3.1.4 RHIPE参考函数
3.2 RHadoop
3.2.1 RHadoop架构
3.2.2 安装RHadoop
3.2.3 RHadoop案例
3.2.4 RHadoop参考函数
3.3 小结
第4章 Hadoop Streaming中使用
4.1 Hadoop Streaming基础概念
4.2 使用R运行Hadoop stre
4.2.1 MapReduce应用程序基础
4.2.2 如何编写MapReduce应用程序
4.2.3 如何运行MapReduce应用程序
4.2.4 如何浏览MapRecuce应用程序的输出
4.2.5 Hadoop MapReduce脚本的基础R函数
4.2.6 管理Hadoop MapReduce任务
4.3 R语言扩展包HadoopStreaming介绍
4.3.1 hsTableReader函数
4.3.2 hsKeyValReader函数
4.3.3 hasLineReader函数
4.3.4 运行Hadoop streaming任务
4.3.5 执行Hadoop Streaming任务
4.4 小结
第5章 利用R和Hadoop学习数据分析
5.1 数据分析项目生命周期
5.1.1 问题定义
5.1.2 设计数据需求
5.1.3 数据预处理
5.1.4 数据分析
5.1.5 数据可视化
5.2 数据分析问题
5.2.1 展示网页分类
5.2.2 计算股市变动频率
5.2.3 案例研究:预测推土机售价
5.3 小结
第6章 应用机器学习做大数据分析
6.1 机器学习介绍
6.2 有监督机器学习算法
6.2.1 线性回归
6.2.2 logistic回归
6.3 无监督机器学习算法
6.4 推荐算法
6.4.1 在R中产生推荐商品的步骤
6.4.2 使用R和Hadoop产生推荐商品
6.5 小结
第7章 从各种数据库中导入与导出数据
7.1 文件型数据库
7.1.1 不同类型的文件
7.1.2 安装R包
7.1.3 将数据导入
7.1.4 从R导出数据
7.2 MySQL
7.2.1 安装MySQL
7.2.2 安装RMySQL
7.2.3 列出数据表及其结构
7.2.4 导入数据进R
7.2.5 数据操纵
7.3 Excel
7.3.1 安装Excel
7.3.2 导入数据进R
7.3.3 R和Excel的数据操纵
7.3.4 导出数据到Excel
7.4 MongoDB
7.4.1 安装MongoDB
7.4.2 安装rmongodb
7.4.3 导入数据进R
7.4.4 数据操纵
7.5 SQLite
7.5.1 SQLite的特性
7.5.2 安装SQLite
7.5.3 安装RSQLite
7.5.4 将数据导师入R
7.5.5 数据操纵
7.6 PostgreSQL
7.6.1 PostgreSQL的特性
7.6.2 安装PostgreSQL
7.6.3 安装RPostgreSQL
7.6.4 从R导出数据
7.7 Hive
7.7.1 Hive的特性
7.7.2 安装Hive
7.7.3 安装RHive
7.7.4 RHive操作
7.8 HBase
7.8.1 HBase的特性
7.8.2 安装HBase
7.8.3 安装Thrift
7.8.4 安装RHBase
7.8.5 导入数据进
7.8.6 数据操纵R
7.9 小结
附录 参考资源
R与Hadoop大数据分析实战(首部全面讲解R语言与Hadoop技术结合应用于大数据分析的优秀著作) pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版