编辑推荐
推荐组合购买:
《大数据分析:决胜互联网金融时代》(大数据落地实践之作,汇集世界**数据专家思想精华,****高级专家团队精心译著,OReilly总经理作序,IBM首席科学家等6位专家联袂推荐)
国内外知名数据分析专家、行业领袖联袂推荐!
世界**数据仓库公司Teradata首席分析专家BillFranks倾力巨献!
揭秘驾驭大数据的技术和方法,诠释大数据专业分析之道!
抓住大数据!理解大数据!驾驭大数据!在大数据掘金浪潮中脱颖而出!
你是否在大数据面前犹豫、恐惧、不知所措?你是否无法说服你的老板投入人力、财力、物力去进行大数据分析?你是否已经身处大数据中而依旧茫然?你是否在做了很多大数据分析后仍然无法发现新的商业价值和机会?
如何不再因循守旧,如何积极主动地去改变、探索、创新,如何在驾驭大数据的过程中游刃有余、成竹在胸?
答案就在《驾驭大数据》一书中!
本书将会告诉你:
什么是大数据?
目前有哪些大数据源?
这些大数据源有什么价值?
有哪些技术和方法可以帮助我们驾驭大数据?
需要招聘什么样的分析师?
如何打造一支Super分析团队?
什么样的文化氛围才能促进分析创新?
 ;
内容简介
本书为读者提供了处理大数据和在你的企业中培养一种创新和发现的文化所需的工具、过程和方法,描绘了一个易于实施的行动计划,以帮助你的企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。
本书主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。
本书适于所有对数据、数据挖掘、数据分析感兴趣的技术人员和决策者阅读。
作者简介
BillFranks是Teradata公司全球合作伙伴计划的首席分析专家,他负责跟踪研究分析领域的前端趋势,帮助客户理解Teradata和其分析合作伙伴如何为客户创造价值。Bill还负责管理Teradata与SAS合作成立的业务分析创新中心,并专注于帮助客户获得创新分析能力。此外,Bill负责制定Teradata公司在高级分析领域的战略与定位。
Bill是国际数据分析研究所的一名讲师,国际数据分析研究所(International Institute forAnalytics)是由分析领域专家Tom Davenport成立的研究机构。Bill还是一名活跃的演讲人和博客作者,他的博客地址是:http://iianalytics.com/category/faculty-blogs/bill-franks。
Bill一直专注于如何将复杂的分析转化为业务人员可以理解的语言,并帮助企业更有效地使用这些分析成果。他曾服务于很多不同行业和公司规模的客户,其中有财富前100强的大型企业,也有小型的非营利组织。
Bill拥有弗吉尼亚科技大学应用统计专业的学士学位,以及北卡罗来纳州立大学应用统计专业的硕士学位。
目录
第一部分 大数据的兴起
第1章 什么是大数据,大数据为什么重要
1.1 什么是大数据
1.2 大数据中的“大”和“数据”哪个更重要
1.3 大数据有何不同
1.4 大数据为何是数量更多的、相同类型的传统数据
1.5 大数据的风险
1.6 你为什么需要驾驭大数据
1.7 大数据的结构
1.8 探索大数据
1.9 很多大数据其实并不重要
1.10 有效过滤大数据
1.11 将大数据和传统数据混合
1.12 对大数据标准的需求
媒体评论
“随着信息技术的飞速发展,人类社会已进入一个数字信息时代。即时获取和掌握信息的多少,己成为衡量一个国家实力强弱的标志。但一切信息,又随不同需求者而定义为有益与否,而一切有益信息都是从海量数据中经过分析而生成的。海量数据又随时间不断产生,不断流动、扩散,形成一股像海潮的大数据流。只有经过对大数据的分析才能形成各自需要的信息,才能从信息中产生知识,才能造就智慧型社会。本书作者就大数据兴起及分析方法和技巧作出了深入浅出的表述,在当前大数据热潮中,值得一读。”
吴基传 原国家信息产业部部长
“信息技术的飞速发展,以及互联网企业商业模式的不断创新,使得全球数据量呈现出几何级数般的爆炸性增长,全球进入了大数据时代。红楼梦中‘任凭弱水三千,我只取一瓢饮’,在浩瀚的信息海洋中,谁能够更快速、更准确地获取有价值的信息并充分利用,谁就能在大数据时代立于不败之地,获得成功。如何充分利用大数据、挖掘大数据所蕴含的价值,需要我们把握大数据的特点,积极探索海量数据存储、实时数据处理、新型分析挖掘技术的应用,以及新的数据架构的设计等解决之道。本书对上述问题进行了深入探讨,提出了许多真知灼见,值得一读。”
王晓初 中国电信集团公司董事长
前沿
你收到一封邮件,邮件中提供了一套个人电脑的报价。而你几个小时前刚刚在这家零售商的网站上搜索过电脑的信息,似乎它们已经读出了你的想法……当你驱车前往这家商店购买这套个人电脑时,你路过了一家咖啡店,你看到了这家咖啡店的一条折扣信息。你获知由于你刚来到这片区域,你可以在未来20分钟内享受10%的折扣……
在你享用咖啡的时候,你收到了一家制造商关于某产品的道歉,而你昨天刚刚在你的Facebook主页和这家公司的网站上抱怨了它们的产品……
最后,当你回到家之后,你又收到了一条关于购买你最喜欢的在线视频游戏升级装备的信息。有了这些装备,你才能顺利通过某些你曾经苦苦挣扎的关卡……
听起来很疯狂吗?难道这些事情都是在很远的未来才发生的吗?不,这些场景都是我们今天可能见到的!大数据、高级分析、大数据分析,似乎今天你已经逃脱不了这些术语了。无论在哪里,你都会听到人们在讨论大数据和高级分析,看到关于它们的文章或是宣传推销它们。好了,现在你也可以将这本书加入关于它们的讨论中了。
什么是真实的,什么是炒作?这些关注可能会使你怀疑大数据分析是一种炒作,而非真实的东西。尽管在过去的几年曾经有不少被炒作的概念,然而就分析能力和处理海量数据而言,我们确实处在一个转型的年代。如果你肯花一些时间来理清并过滤掉那些有时被媒体过分炒作的部分,你会发现大数据背后有一些非常真实和强大的东西。随着时间的推移,大数据分析会使企业和消费者都获益,而收益带来的兴奋和期待又会继续引发更多的炒作。
大数据是下一波新数据源的浪潮,并会驱动分析在商业、政府及教育界的下一次革新。这些革新将有可能快速地改变企业审视它们自身业务的方式。大数据分析可以促成更加明智的决策,在某些情况下,促成这些决策的方式将明显不同于今天。它带来的很多洞察在今天看起来都像是在做梦。你会看到,征服大数据的需求和一直以来征服新数据源的需求在很大程度上是一致的。然而,大数据的额外规模必须使用新的工具、技术、方法和流程。传统的分析方法已经不再适用于新的环境,我们有必要使用高级分析将商业界带入更高的层次。这就是这本书要讲的内容。
“驾驭大数据”并不只是本书的书名,而是下一个十年中,决定哪些商业活动将振兴,而哪些商业活动将消亡的决定性因素。准备主动接受大数据,企业可以通过驾驭大数据浪潮而取得成功,而不是遭受大数据浪潮连绵不断的拍打。你需要了解些什么?你如何为征服大数据做准备?你如何从大数据中获得振奋人心的分析结果?坐下来,找一个舒服的姿势,准备好发现大数据的秘密!
读者对象
这些年来有无数关于高级分析的书籍问世,最近也开始有关于大数据的书籍出现。本书是从一个与其他书籍不同的角度来看大数据的,主要帮助读者理解什么是大数据,如何通过分析来利用大数据,以及在如今的大数据环境中,如何处理世界范围内的高级分析生态系统的创新和变革。大部分读者都将发现这本书有价值且充满趣味。无论你是分析专家,还是使用分析结果的商人,或者只是对大数据和高级分析感兴趣的人,这本书都有适合你阅读的内容。
本书并不会深入介绍它所涉及主题的技术细节。本书的技术高度刚刚能够让读者从高层次来理解其所讨论的概念。本书的目的是使读者可以理解,并开始运用这些概念,以及帮助他们认识在哪些方面还需要更加深入的研究。这本书更像是一本手册而非教科书,完全可以被非技术人员理解和掌握。同时,那些对这些主题已经有深入了解的读者,也可以从本书的一些讨论中获得一些技术方面更深层次的启示。
内容提要
本书由四部分组成,每一部分都从一个方面来介绍如何驾驭大数据浪潮。第一部分将介绍什么是大数据,大数据为什么重要,以及如何应用大数据。第二部分集中介绍那些能够用于分析和操作大数据的工具、技术和方法。第三部分介绍如何使分析专家、分析团队以及所需的分析原则更加高效。第四部分将前三部分结合在一起,重点介绍了如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。以下是关于各章节所涉及内容的详细提纲。
第一部分 大数据的兴起
第一部分重点介绍了什么是大数据,大数据为什么重要,以及分析大数据可以带来什么好处。本部分覆盖了10种类型的大数据源,以及如何利用这些资源来帮助企业提高其业务水平。如果读者拿起这本书时,还不知道什么是大数据,以及大数据的应用有多么广泛,那么第一部分会帮助你了解这部分内容。
第1章 什么是大数据,大数据为什么重要
本章首先介绍了大数据的背景知识,以及大数据到底是关于什么的。然后给出了一些企业如何利用大数据的案例。如果读者想要帮助他们的企业驾驭大数据浪潮,那么请首先理解本章所讲的内容。
第2章 网络数据:原始的大数据
如今,或许应用最为广泛并为人们所熟知的大数据源是从互联网网站上收集来的详细数据。用户浏览互联网所产生的日志信息,是等待分析和挖掘的信息宝库。不同行业的企业都将从它们网站上收集到的详细用户信息整合到它们的企业业务分析中。本章将探索这些数据将如何增强和改变一系列的商务决策。
第3章 典型大数据源及其价值
在本章中,我们将从高层次来探索9种大数据源。其目的是介绍每种数据源,并讨论每种数据源在商业中的应用和启示。一些本质相同的技术应用在不同的行业中,以产生多种大数据源,这个趋势已经越来越明显。另外,不同的行业可以利用一些相同的大数据源,大数据并非只能用于某些狭窄的领域。
第二部分 驾驭大数据:技术、过程以及方法
第二部分将集中介绍用于驾驭大数据的技术、过程以及方法。这些年取得的重大进展增加了这3个方面的可扩展性。企业不能继续依赖外部的方法和专家来保持它们在大数据世界中的竞争力。本书的这一部分将是技术性最强的一部分,但仍然可以被绝大多数的读者所理解和接受。读完这些章节后,读者将熟悉他们今后进入大数据分析领域时可能遇到的一系列概念。
第4章 分析可扩展性的演进
在每一个时期,数据的高速增长使得当时最具可扩展性的工具也只能疲于应付。在大数据出现之前,传统的高级分析方法已经到达了它们的瓶颈。如今,传统的方法已经不再适用。本章将讨论分析和数据环境的融合、海量并行处理(MPP)体系、云、网格计算,以及MapReduce技术。这些技术增强了可扩展性,并且在大数据分析中扮演着重要角色。
第5章 分析流程的演进
为了更好地利用被极大增强的可扩展性,分析流程也需要进行升级。本章将首先概述如何利用分析沙箱为分析专家提供一个可扩展的环境,从而建立高级分析流程。然后,我们将介绍企业分析数据库如何帮助在创建分析数据时,获得更高的一致性并减小风险,同时提高分析专家的生产效率。本章最后将探讨如何使用嵌入式评分过程将高级分析流程部署和转移到用户端和应用端。
第6章 分析工具和方法的演进
本章将介绍一些高级分析方法演进的过程,以及这些改进将如何继续改变分析专家完成工作和处理大数据的方式。讨论的主题将包括视觉角度、点击界面、分析解决方案、开源工具,以及数据可视化工具的演进。本章也讲述了分析专家将如何改变他们建模的方法,以便更好地利用可用资源。讨论的主题包括组合模型、简易模型以及文本分析。
第三部分 驾驭大数据:人和方法
第三部分重点讨论驾驭大数据的人和他们所属的团队,以及确保他们能够提供优质分析的方法。如何提供优质的分析,包括大数据分析,其关键因素是找到合适的人来掌舵,并且他们能够遵循正确的分析原则。读完这3章后,读者将了解优质分析、优秀的分析专家和分析团队的特质。
第7章 如何提供优质分析
计算统计结果、撰写报告、使用建模算法仅仅是创建一个优质分析众多步骤中的几步。本章首先阐述了一些定义,然后讨论了一系列关于如何创建优质分析的主题。大数据给企业带来了从未处理过的复杂数据组合,将本章讨论的原则牢记在心对驾驭大数据非常关键。
第8章 如何成为优秀的分析专家
数学、统计学以及编程方面的能力是必要的,但对于一个优秀的分析专家来说,仅仅具备这些技能还不够。优秀的分析专家还需要具备一些人们通常不会首先想到的特质。这些特质包括承诺、创造力、商业头脑、演讲能力与沟通技巧以及直觉。本章将探讨在寻找一个优秀的分析专家时,这些特质为什么非常重要且不能被忽视。
第9章 如何打造优秀的分析团队
企业如何打造一个高级分析团队,并使其发挥最优效果?把他们放在企业的什么位置最合适?这些团队如何运转?谁来创建高级分析?本章将讨论建立一个优秀的分析团队时必须考虑的一些常见挑战和原则。
第四部分 整合:分析文化
第四部分将介绍一些著名的基本原则,企业想利用高级分析和大数据进行成功创新必须遵循这些原则。尽管这些原则也被广泛地应用于其他领域,但我们的焦点和视角是这些原则将要如何应用于当前企业环境的高级分析中。读者可能已经比较熟悉所涉及的这些概念,但是对于如何将它们应用到高级分析和大数据中,也许还是很陌生的。
第10章 促进分析创新
本章从回顾一些成功创新背后的基本原则开始,然后通过分析创新中心的概念将它们应用到大数据和高级分析中。我们的目标是能够让读者清楚地理解如何在企业中更好地促进分析创新,并驾驭大数据。
第11章 营造创新和探索的文化氛围
本章将介绍如何营造创新和探索的文化氛围作为本书的结尾。本章的文字有趣而轻松,并给如何营造出有利于促进创新分析的文化氛围留出了一些思考空间。这些涉及的原则被广泛地讨论,并被大家熟知。但是,这些原则仍然值得回顾,并且需要思考企业如何将这些确立的原则应用到大数据和高级分析中。
驾驭大数据(百道网2013年潜力新书推荐!国内外知名数据分析专家、行业领袖联袂推荐!) pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版