Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统 PDF下载

编辑推荐

大数据类型多样、数量庞大、变化快速，这些特征对大数据分析师提出了新挑战。作为一种应对方案，大数据分析技术广泛应用于物联网、云计算等新兴领域，能够帮助企业用户在合理时间内处理海量数据，并为改善经营决策提供有效帮助。目前，存在多种大数据分析工具，相关技术正在不断走向成熟。Hadoop 作为一种优秀的开源框架，基于该架构的数据分析应用具有显著技术优势和应用前景，目前与Hadoop 大数据分析相关的出版物中，大多偏重于理论和技术介绍，有关具体应用实践方面的书籍相对偏少。为了满足应用需求，《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》以设计并实现用于获取、分析、可视化大数据集的软件系统为目标，以应用案例为背景，系统地介绍利用Hadoop 及其生态系统进行大数据分析的各种工具和方法；本书讲述Hadoop 大数据分析的基本原理，呈现构建分析系统时所使用的标准架构、算法和技术，对应用案例进行了深入浅出的剖析，为读者掌握大数据分析基础架构及实施方法提供了详明实用的方案。《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》在注重Hadoop 数据分析理论的同时，与大数据分析案例实践相结合，以生物、电信、资源勘查等行业真实案例为主线，详细讲解Hadoop 高级数据分析的过程。使读者可以自己动手实践，亲自体会开发的乐趣及大数据分析的强大魅力。通过本书的学习，读者能够更加快速且有效地掌握Hadoop 数据分析方法并积累实践经验。阅读《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》，可以帮助读者了解并掌握Hadoop 高级数据分析技术的具体操作方法，让读者真正理解其核心概念和基本原理。

内容简介

掌握Hadoop高级数据分析技术
　　学习高级分析技术，并利用现有工具包使分析应用更加强大、精确和高效！《Hadoop高级数据分析　使用Hadoop生态系统设计和构建大数据系统》将架构、设计及实现信息恰当地融为一体，将指导你创建超越基础方法(SF分类、聚类、推荐)的分析系统。
　　在《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》中，*实践强调“确保连贯、高效的开发”。将使用包含工具箱、库、可视化组件和报表代码在内的标准第三方组件，借助集成“组合件”开发一个可运行的、可扩展的、端到端的完整示例系统。
《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》强调以下四点：
● 具有分析组件及合理可视化结果的完整、灵活、可配置、高性能数据管道系统的重要性。深入探讨的主题包括Spark、H2O、Vopal Wabbit(NLP)、Stanford NLP、Apache Mahout，以及其他适用的工具包、库和插件。
● *实践和结构化设计原则。包括重要主题及示例部分。
● 用混合搭配或混合系统实现应用目标的重要性。你在学习深度示例时可体会到混合方法的重要性。
● 使用现有第三方库是有效开发的关键。在开发示例系统时，深度示例将展示一些第三方工具包的功能。

作者简介

Kerry Koitzsch在计算机科学、图像处理和软件工程等领域拥有超过二十年的工作经验，致力于研究Apache Hadoop和Apache Spark技术。Kerry擅长软件咨询，精通一些定制的大数据应用，包括分布式搜索、图像分析、立体视觉和智能图像检索系统。Kerry目前就职于Kildane软件技术股份有限公司，该公司是加州桑尼维尔市的一个机器人系统和图像分析软件提供商。

Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统 PDF下载