欢迎光临
免费的PDF电子书下载网站

中国云计算应用丛书--大数据精准挖掘 PDF下载

编辑推荐

  作者EMC2公司的工作经历、深厚的专业基础、精准的数据挖掘工具、结合实践的成功案例,使本书价值斐然,值得推荐!

中国云计算应用丛书--大数据精准挖掘 PDF下载

 ;

内容简介

  本书以新兴的大数据时代最实用的技术为支撑,以广阔的科技视野和扎实的专业功底,全面介绍了大数据时代的由来和背景,阐述了与大数据分析相关的理论和数学模型。特别难能可贵的是,本书从蕴含大数据技术的精准数据挖掘工具入手,结合实际的成功案例,将数据精准挖掘的全过程和详细步骤,包括结果验证等方面内容,详详细细并非常专业地展现给读者。本书理论和实践密切结合,文字流畅,深入浅出,通俗易懂。

  通过本书的学习,可以掌握当下大数据所涉及的主要数学分析模块的要点,并比较相互的特点。同时,能够学会实用的数据挖掘专门技术及经历数据挖掘的全过程。由于本书所介绍的技术与我国目前大数据运用的领军行业金融、保险、电信、电子商务等密切相连,故本书有很强的实用性,能达到学以致用、边学边用的效果。

  本书适合我国IT业的科研机构、相关企业的专业技术人员的学习之用;本书还可以作为政府部门制定大数据发展战略时的参考。本书也适合全国高等院校的大学生和研究生学习使用;由于本书将理论与具体操作合二为一,故也能作为全国大专院校开设大数据实验课程的教材。

作者简介

暂无

中国云计算应用丛书--大数据精准挖掘 PDF下载

目录

第1篇基础篇

第1章大数据时代下的数据挖掘
1.1大数据的基础
1.1.1大数据呈现出了数据的新价值
1.1.2数据采集、存储与提取技术信息化
1.1.3数据挖掘技术是大数据时代最本质特征
1.2大数据的特点
1.2.1数据规模大
1.2.2数据类型多
1.2.3价值密度低,但总体的数据价值高
1.2.4数据处理有速度要求
1.3大数据的作用
1.3.1数据已渗透到社会每个角落
1.3.2数据成为竞争的新元素
1.3.3数据创造新价值
1.3.4大数据地位不断跃升
1.4大数据与数据挖掘
1.4.1数据挖掘技术是大数据时代的灵魂和核心
1.4.2数据挖掘技术涉及多种多类的知识节点
1.4.3选择最好的数据挖掘工具
1.5令人期待的大数据时代
1.6本章小结

第2章大数据与云计算
2.1大数据与云计算
2.1.1大数据与云计算关系
2.1.2大数据扩展了云计算服务类型
2.1.3云计算数据存储系统得到推广
2.1.4追求集成一体化技术
2.1.5大数据和云计算缺一不可
2.2云计算的定义与特点
2.2.1云计算的定义
2.2.2云计算的特点
2.3云计算的基本架构
2.3.1云计算架构的基本层次
2.3.2云计算架构的服务层次
2.4云计算的关键技术
2.4.1虚拟化技术
2.4.2数据存储技术
2.4.3资源管理技术
2.4.4云计算中的编程模型
2.4.5集成一体化技术
2.4.6自动化技术
2.5云计算的商业模式
2.5.1商业模式是云计算的基石
2.5.2云计算的市场规模
2.5.3云计算商业模式分析
2.6本章小结

第2篇理论篇
第3章数据挖掘的主要方法及工具
3.1数据挖掘主要方法
3.1.1决策树分类
3.1.2神经网络
3.1.3Logistic回归方法
3.1.4聚类分析
3.1.5数据挖掘方法比较
3.1.6分类器的评估与选择
3.2流行数据分析平台及数据挖掘工具介绍
3.3本章小结

第4章Logistic回归模型
4.1多元线性回归模型
4.2Logistic回归模型
4.3Logistic回归模型的参数估计
4.4Logistic回归模型中回归系数的意义
4.5Logistic回归模型的拟合优度
4.6Logistic回归系数的显著性检验
4.7Logistic回归模型的预测准确性
4.8回归变量的选择与逐步回归
4.9本章小结

第5章数据挖掘建模过程
5.1CRISP.DM
5.2SAS数据挖掘方法论——SEMMA
5.3数据挖掘经验谈
5.4本章小结

第3篇应用篇
第6章金融行业应用1——信用评分
6.1国内信用卡业务现状
6.2信用评分模型的起源、类别和发展
6.3信用评分的步骤
6.4实例演示
6.4.1二元变量预测建模
6.4.2图形版建模输出讲解1——效果评价
6.4.3图形版建模输出讲解2——评分卡文件
6.5本章小结

第7章金融行业应用2——信用卡催收评分
7.1信用卡催收评分模型背景介绍
7.2实例演示
7.2.1图形版连续变量预测建模
7.2.2图形版建模输出
7.3本章小结

第8章保险电销应用——寻找目标客户
8.1背景介绍
8.2案例数据展示及分析
8.2.1业务目标
8.2.2数据展示
8.3数据挖掘与分析过程
8.3.1数据预处理
8.3.2造变量
8.3.3生成挖掘表
8.3.4建立响应模型
8.3.5建模结果分析
8.4数据挖掘结果的运用
8.5本章小结

第9章电信行业应用——客户流失预测
9.1背景介绍
9.2案例数据展示及分析
9.2.1商业理解
9.2.2数据理解
9.2.3数据准备
9.3建立打分模型
9.4分析建模结果
9.5数据挖掘结果的运用
9.6本章小结

第10章商品零售行业应用——购物篮分析
10.1某连锁零售公司的背景介绍
10.2购物篮分析的基本内容
10.2.1同次购买的基本概念
10.2.2同次购买的关联规则质量的衡量
10.2.3购买分析的实现
10.2.4下次购买的基本概念
10.2.5下次购买行为预测
10.3购物篮分析——MBA工具的使用
10.3.1MBA工具的用途
10.3.2MBA工具的使用
10.3.3MBA工具的输出
10.4本章小结

第11章实战项目——交叉销售
11.1背景介绍
11.2案例数据展示及分析
11.2.1数据展示
11.2.2业务目标及分析要求
11.3数据挖掘过程
11.3.1数据预处理
11.3.2划分数据集及生成目标变量
11.3.3生成衍生变量
11.3.4生成挖掘表
11.4建立打分模型
11.5结果分析
11.6本章小结

第12章收益预测
12.1背景介绍
12.2数据展示
12.2.1原始数据集展示
12.2.2数据挖掘表的生成
12.3图形版建模
12.3.1建模过程
12.3.2模型输出
12.3.3为新数据集打分
12.4本章小结
参考文献

前沿

  过去,在产品经济年代,一提到“基础设施”,人们便知道这是指:水、电、气;路、桥、隧;铁(路)、公(路)、机(场)等。因为原材料与制成品的运输、产品的制造必须仰仗这些基础设施。可是在数字化、服务经济的今天,“基础设施”还得加上“大、云、平、移”(大云平移)这几项。
  那么,何为大云平移?
  大就是大数据,即通过云计算、移动互联网等手段,从各类数据中快速获得有价值信息的能力。它具有体量巨大(Volume)、类型繁多(Variety)、价值低密度(Value)和处理快速(Velocity)的4V特点。它将在海量数据中挖掘事物的规律和特征,这是传统科学家和传统科研方法永远做不到的。
  云就是云计算,从本质上说就是一种公共服务,就如100年前电的应用也是公共服务一样,现已证明云的普及只是转瞬之间发生的事。
  平就是平台,有交易平台、媒体平台、支付平台、软件平台等。全球品牌500强前十名中有6个是平台型企业;中国500强企业前40名中,利润最丰厚的是平台型企业,如百度、网易、腾讯、阿里巴巴等。平台型企业是当下企业的巨无霸。
  移就是移动互联网,即互联网加移动通信,近年来它在国内外的发展极为迅速,未来十年,它的全方位应用将让人怦然心动。
  作为一种基础设施,大云平移正影响着许多产业。比如银行的前台(业务部门、市场拓展)、中台(信贷审批、市场监控、风险管理、规划与财务、政策管理与监管合规)与后台(集中处理、信息系统、呼叫中心、集团后勤),都有体现。2008年,银行后台开始应用这些基础设施;2009年,前台也开始运用大数据作分析,包括客户分级、精准营销、易流失客户群体的评判等。至于中台,例如银行规划商业网点的布点布局问题,在产品经济时代,只是简单地应用线性规划、运筹学就可以确定了。而在目前的数字化服务经济时代,银行商业网点布局会从资金流、信息流出发,更多地采用数字化、大数据等技术来解决。比如IBM提供的MCLP(最大覆盖选址)技术,其优化后的整体解决方案就很有效。
  大云平移,精彩无比,但入门之功源起(大)数据挖掘。数据挖掘(DataMining)是从大量的、不完全的、模糊的、随机的、实际应用的数据中提取潜在有用的信息和知识的过程,可以帮助决策者找寻规律、预测趋势、防范疏漏。数据挖掘是一门交叉学科,涉及数据库、人工智能、机器学习、统计学、模式识别、高性能计算等等。
  一些专家认为,数据挖掘的一般过程是:①数据准备(包括数据清理、数据集成和数据选择等);②数据挖掘;③模式评估;④知识表示。常用的数据挖掘模式包括:关联规则模式、生物数据的序列比对、图模式、空间数据挖掘模式等。据国际知名权威机构IDC对欧洲和北美62家采用了数据挖掘技术的企业的调查分析发现,这些企业的3年平均投资回报率为401%,其中25家企业的投资回报率超过600%!
  海量数据是金矿银矿,但海量数据不是金银财宝。挖掘、采集矿藏并筛选冶炼之后才能获取财富。面对浩瀚的结构性、非结构性的海量数据,传统技术已苍白无力。不过,知识就是力量,近年来国内外已出版了多本有关大数据的书籍,可资学习。但迄至今日,概念类的偏多,应用性强的书籍不多,业界和企业亟盼急需的是实用的大数据技术及成功案例。《大数据精准挖掘》是握有国内外众多成功案例、讲授国内外有效地应用据数挖掘原理与操作的一本新书、好书。
  “基础在(大)数据、游走在云端,运作在平台、胜出在移动”是阿里巴巴、腾讯等企业的成功秘籍之一。如果说这一秘籍昭示了在未来“大云平移”是企业不可或缺的、时时处处都将使用的基础设施的话,那么,《大数据精准挖掘》从应用数学的角度揭示了数据挖掘将是构造这一基础设施的基础设施。

  中欧国际工商学院院长、管理学教授
  上海数字化与互联网研究中心主任

  2013年8月

免费在线读

  第6章主要讲解在金融行业信用卡业务中,国内信用卡业务现状,以及国际信用评分的起源和发展。
  6.3讲解了业内人士总结的信用评分的6个步骤,商业理解、数据理解、数据准备、建立模型、模型评估、决策实施。
  6.4节演示了一个信用卡评分的实例,建模工具为数据1号图形命令版的二元变量预测模块。其中详细讲述了怎样利用数据1号连接数据集,怎样设置自变量应变量,运行程序完毕后怎样查看结果、怎样查看评分卡等等。
  银行信用卡评分业务中,涉及的是否坏账是一个二元因变量问题。在银行中,也会涉及连续型因变量的问题,第7章信用卡催收评分就涉及此类。
  第7章主要涉及银行信用卡行业的信用催收评分,目标是为持卡人逾期还款金额进行风险评估。建模所利用的信息包括两部分,持卡人基本信息和持卡人在持卡期间的消费记录和还款记录,若条件允许,可以向权威机构购买此人的信用情况。建模的工具选择的数据1号图形版。
  利用建好的模型,可对持卡人逾期还款金额进行风险评估。依据评估的结果,银行可以预估哪些持卡人的逾期未还款通过自己的催收员能够收到还款,能够收到多少还款。而对于那些不易收取还款的信用卡持卡人,银行将其外包给第三方业务公司。
  信用评分和信用卡催收评分作为风险评估工具,在银行业应用非常普遍。对于这两类模型,对模型的稳定性和精准度要求相对较高,模型的精准度差一点点,就会牵涉几千万甚至几亿资产。银行选取的建模工具必然要求较高的稳定性和精准性。
  第8章主要讲解数据挖掘在保险电销行业寻找目标客户中的应用。很多领域都涉及电话营销渠道,特别是保险行业。从茫茫人海中找到对保险有需求的客户不是一件容易的事情,现在一些大的保险公司走的路线是先向客户推广免费的赠险,然后再向赠险客户推广消费险。而YBB正是这样的一家外包公司。
  通过对其海量数据的分析,以及业务现状的了解,为其制定了寻找目标客户的方案。通过建模,得到每位赠险客户买消费险的概率。YBB拿到这份名单,选取其中概率较高的70%的客户营销,达到的效果是原来的96%。节省的这30%的人力成本是一笔巨额的开支,随着数据的采集和收集进一步优化,相信建模的效果越来越好。
  各个行业的电话营销都可以通过数据挖掘来筛选客户,优先选取优质客户进行营销,节省人力成本,提高销售效果。在人力成本越来越贵的今天,数据挖掘可以让每个人的效率更高,使企业盈利得到质的飞跃。
  ……

中国云计算应用丛书--大数据精准挖掘 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:中国云计算应用丛书--大数据精准挖掘