欢迎光临
免费的PDF电子书下载网站

Hive实战 PDF下载

编辑推荐

面对与日俱增的海量数据,能否从中提取商业价值直接关乎公司的市场竞争力。Hive是大数据生态圈必不可少的数据仓库,它为存储在Hadoop文件系统中的数据提供便捷的类SQL查询、统计和分析,从而为公司进入大数据生态圈并迈向商业智能铺平道路。 本书着眼于Hive在真实环境中的应用,内容囊括Hive的方方面面,是针对大数据分析人员的实践参考指南。 - 理解Hive的架构和数据类型 - 高效执行DML操作 - 查询半结构化数据 - 巧妙提升Hive的性能 - 了解Hive的安全性及发展趋势 ;

内容简介

Hive“出身名门”,是*初由Facebook公司开发的数据仓库工具。它简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。本书由数据库专家和大数据专家共同撰写,具体内容包括:Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性,等等。本书旨在为读者打牢基础,从而踏上专业的大数据处理之旅。

作者简介

斯科特·肖(Scott Shaw) Hortonworks公司解决方案工程师,曾为微软公司的商业智能项目担任顾问,拥有近20年的数据管理经验。作为演讲者和培训师,他致力于普及分布式计算、大数据概念、商业智能、Hive和Hadoop。 安德烈亚斯·弗朗索瓦·弗穆尔恩(Andreas Fran?ois Vermeulen) 集数据科学家、数据仓库架构师、博士研究员、企业顾问等角色于一身,曾获“英国数据科学技术先锋”称号,广泛涉足数据工程、商业智能、云架构、深度学习等多个领域。 安库尔·古普塔(Ankur Gupta) Hortonworks公司解决方案工程师,曾在Oracle公司担任顾问,有多年从事数据架构师和Oracle数据库管理员的经验,著有Oracle GoldenGate 11g Complete Cookbook。 戴维·杰鲁姆加德(David Kjerrumgaard) Streamlio公司解决方案架构主管,曾是Hortonworks公司的系统架构师和数据流实践主管,拥有Certified Developer for Apache Hadoop认证,精通Hive、Kafka、Spark、Storm等技术。

Hive实战 PDF下载

目录

第 1章 为Hive打好基础:Hadoop 1

1.1 一只小象出生了 2

1.2 Hadoop的结构 3

1.3 数据冗余 6

1.3.1 传统的高可用性 6

1.3.2 Hadoop的高可用性 9

1.4 MapReduce处理 12

Hive实战 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:Hive实战