编辑推荐
随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了“大数据”(Big Data)的概念,并声称人类已经脱离了信息时代(Information Time,IT),进入了大数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业,谁能获取*量的数据,展开*精准的数据挖掘与建模分析,并加以精细化的落地实施,谁便能在行业竞争中取得优势。
对于运营商企业而言,其具备的一个显著优势便是手握海量数据资源。如果能运用先进的数据挖掘技术找出客户的行为规律,从传统的经验式、粗放式、“一刀切”式的运营决策向数据化、精细化、个性化的运营决策转型,运营商将迎来新的腾飞。上述运营模式转型的目标,便是所谓的“智慧运营”。 ;
内容简介
本书系统地介绍了大数据挖掘的基本概念、经典挖掘算法、挖掘工具和企业智慧运营应用案例。 全书分为9章,内容包括:大数据挖掘与智慧运营的概念,数据预处理,数据挖掘中的四种主流算法:聚类分析、分类分析、回归分析、关联分析,增强型数据挖掘算法,数据挖掘在运营商智慧运营中的应用案例,未来大数据挖掘的发展趋势等。 全书以运用大数据挖掘方法提升企业运营业绩与效率为主线,从运营商实际工作中选取了大量运营和销售案例,详细讲述了数据采集、挖掘建模、模型落地与精准营销的全部过程。书中大部分案例的代码、软件操作流程和微课视频可以通过扫描本书封底的二维码下载。 本书主要面向运营商及其他高科技企业员工、高等院校相关专业本科生和研究生,以及其他对数据挖掘与精准营销感兴趣的读者。
作者简介
梁栋,博士毕业于北京邮电大学信号与系统专业,现任教于北京邮电大学,硕士研究生导师,曾主持和参加多项国家自然科学基金项目、国家863课题项目、国家973科技项目和多项省部级科研项目,主要研究方向为大数据、数据挖掘与智慧运营,所带领的研究团队在包括IEEE Internet of things Journal、IEEE International Conference on Data Mining等著名学术期刊和会议上发表高水平学术论文20多篇,并且长期与中国移动等运营商企业进行科技产业化合作,在大数据、数据挖掘技术运用于企业智慧化运营方面有着丰富的落地经验。
目录
第1章大数据、数据挖掘与智慧运营综述 1
8.4.4 多元线性回归建模350
8.4.5 制定层次化、个性化精准营销方案351
8.4.6 落地效果评估与模型调优352
8.5 客户保有 353
8.5.1 总结客户流失的历史规律354
前沿
数据挖掘(Data Mining),是指从数据中发现知识的过程(Knowledge Discovery
in Databases,KDD)。狭义的数据挖掘一般指从大量的、不完全的、有噪声的、模糊
的、随机的实际应用数据中,提取隐含其中的、人们事先不知道的、但又是潜在有用
知识的过程。自从计算机发明之后,科学家们先后提出了许多优秀的数据挖掘算法。
2006年12月,在数据挖掘领域的权威学术会议the IEEE International Conference on
Data Mining(ICDM)上,科学家们评选出了该领域的十大经典算法:C4.5、K-Means、
SVM、Apriori、EM、PageRank、 AdaBoost、kNN、Naive Bayes和CART。这是数据
挖掘学科的一个重要里程碑,从此数据挖掘在理论研究和实际应用两方面均进入飞速
发展时期,并得到广泛关注。
在实际生产活动中,许多问题都可以用数据挖掘方法来建模,从而提升运营效率。
例如,某企业在其移动终端应用(App)上售卖各种商品,它希望向不同的客户群体
精准推送差异化的产品和服务,从而提升销售业绩。在这个案例中,如何将千万量级
的客户划分为不同的客户群体,可以由数据挖掘中的聚类分析算法来完成;针对某个
客户群体,如何判断某个产品是否是他们感兴趣的,可以由数据挖掘中的分类分析算
法来完成;如何发现某个客户群体感兴趣的各种产品之间的关联性,应该把哪些产品
打包为套餐,可以由数据挖掘中的关联分析算法来完成;如何发现某个客户群体的兴
趣爱好的长期趋势,可以由数据挖掘中的回归算法来完成;如何综合考虑公司的KPI
指标、营销政策和App页面限制等条件,制订最终的落地营销方案,可以基于数据
挖掘中的ROC曲线建立数学模型求得最优解来解决。
当前,许多企业正面临前所未有的竞争压力。以运营商企业为例,从政策层面看,
国家提出了“提速降费”的战略指示:一方面要提高网络连接速度、提供更好的服务,
这意味着公司成本的提高;另一方面要降低资费标准,这意味着单个产品收入的下降,
运营商该如何化解这对矛盾?从运营商内部数据统计看,传统的语音和短信、彩信业务收入占比正不断下降,传统的利润点已经风光不再;流量收入目前已占据主要位置
并保持上涨趋势,但单纯的流量经营又将面临“管道化”压力;未来的利润增长点要
让位于被称为“第三条曲线”的数字化服务。运营商该如何经营这一新鲜事物?从外
部环境看,互联网和电子商务企业借助其在各方面的优势,已经对运营商形成了巨大
的压力,特别是在数字化服务营销领域,传统运营商企业已经不再具备优势,又该如
何应对互联网企业的全面竞争?
随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人
们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记
录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了“大数据”(Big
Data)的概念,并声称人类已经脱离了信息时代(InformationTime,IT),进入了大
数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层
次知识。对于同一竞争领域的企业,谁能获取最大量的数据,展开最精准的数据挖掘
与建模分析,并加以精细化的落地实施,谁便能在行业竞争中取得优势。对于运营商
企业而言,其具备的一个显著优势便是手握海量数据资源。如果能运用先进的数据挖
掘技术找出客户的行为规律,从传统的经验式、粗放式、“一刀切”式的运营决策向
数据化、精细化、个性化的运营决策转型,运营商将迎来新的腾飞。上述运营模式转
型的目标,便是所谓的“智慧运营”。
目前,人类对大数据尚没有统一的、公认的定义,但几乎所有学者和企业都认同
大数据具备四大特征(四大挑战):体量巨大(Volume )、类型繁多(Variety )、价
值密度低(Value )、需要实时处理(Velocity )。这其中最重要的一点是类型繁多,
即过去人类的数据储备以结构化数据为主,而未来将以非结构化数据为主。回到之前
提到的App 营销案例,企业基于用户的基础信息、历史消费信息、简单的网络行为
信息等结构化数据展开挖掘建模,被认为是传统的“基于数据挖掘的智慧运营”。随
着时代的发展,企业还掌握了用户观看在线视频的内容数据、在营业网点接受营业员
推荐的表情信息和语言交流数据、用户在客服热线中的语音咨询数据等。这些数据被
统称为非结构化数据,随着语音识别、人脸识别、语义识别等新技术的发展成熟,对
非结构化数据的分析挖掘已成为可能,并将获得广阔的商业应用空间。基于非结构化
数据的挖掘建模又被称为“基于人工智能的智慧运营”。考虑当前大部分企业的实际
运营现状,本书将主要围绕“基于数据挖掘的智慧运营”展开讨论,“基于人工智能
的智慧运营”将在后续书籍中展开讨论。
本书共分为九章:第1 章大数据、数据挖掘与智慧运营综述,讲述数据挖掘的基
本概念和发展史、大数据的时代特征、当前结构化数据挖掘进展、非结构化数据挖掘
免费在线读
2. 数据挖掘算法的应用
数据挖掘算法可以挖掘出很多意想不到的规律,不仅有助于推进很多理论技术的发展,还可以帮助商家赚取利润。
数据挖掘应用中,有一个很经典的“啤酒 尿布”案例。某著名超市在对消费者购物行为进行关联分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。
2009年,Google通过分析5000万条美国人最频繁检索的词语,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终Google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。
数据挖掘的结果还曾让英国撤军。2010年10月23日《卫报》利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标单击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达39万,显得格外触目惊心。一经刊出立即引起英国朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。
数据挖掘对医学领域的影响也十分重要。举一个比较著名的人物——乔布斯。乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几十万美元的费用。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。
大数据、数据挖掘与智慧运营 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版