欢迎光临
免费的PDF电子书下载网站

并行数据挖掘及性能优化——关联规则与数据相关性分析 PDF下载

编辑推荐

暂无

内容简介

大数据推动了各行各业的迅猛发展,各领域呈现出新产品、新技术、新服务和新的发展业态,但“信息丰富而知识贫乏”的现象仍然存在。逾越数据与知识之间的鸿沟,需要强有力的分析工具和分析方法的支撑。现有的关联规则挖掘算法,因其时空复杂性和I/O代价高,难以适应大数据分析任务。本书充分利用Hadoop、Spark等集群系统的强大数据处理能力,论述了支持大数据分析的关联规则并行挖掘算法与集群系统性能优化,并探讨了其在智能制造领域的应用。本书可供从事数据挖掘、机器学习及并行计算等相关专业的科研人员参考,也可作为高等院校计算机、大数据专业的高年级本科生与研究生的学习参考书。

作者简介

荀亚玲,女,1980年生,山西临汾霍州人,博士,现任太原科技大学计算机科学与技术学院副教授。在科研方面一直从事数据挖掘和并行与分布式计算等方面的研究工作。在关联规则挖掘、天体光谱数据挖掘技术、并行与分布式计算等领域进行了理论和应用研究,已取得了一些阶段性的研究成果。先后参与了多项国家自然科学基金、国家"863”高技术发展计划基金项目子课题。主持国家青年基金项目1项("MapReduce集群环境下的恒星光谱关联规则挖掘及性能优化”项目(编号:61602335))。在《IEEE Transactions on Systems, Man, and Cybernetics: Systems》、《软件学报》等国内外期刊上, 已公开发表了第一作者学术论文若干,其中: SCI收录1篇, EI收录2篇;在《Soft Computing》、《Knowledge-Based Systems》、《软件学报》等期刊上,合作发表了论文十余篇;此外,以第一作者撰写的《FiDoop-DP: Data Partitioning in Frequent Itemset Mining on Hadoop Clusters》论文,已被CCF推荐的A类国际顶级SCI期刊《IEEE Transactions on Parallel and Distributed Systems 》,于2016年5月录用。2016年5月,《一种基于云存储的校园安防系统》获授权国家专利,专利号:ZL 2015 2 1058772.7。

并行数据挖掘及性能优化——关联规则与数据相关性分析 PDF下载

目录

目录 
第一篇 基础理论篇
第1章 绪论 3
1.1 数据挖掘 4
1.1.1 数据挖掘的产生和定义 4
1.1.2 数据挖掘的任务与分类 6
1.1.3 研究前沿和发展趋势 8
1.2 关联规则 9
1.2.1 关联规则及其分类 9
1.2.2 关联规则挖掘算法 12
1.3 集群系统与并行计算模型 17
1.3.1 集群系统 17
1.3.2 并行计算模型 18
1.3.3 大数据处理架构Hadoop与Spark 21

前沿

前言
数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产要素。大数据虽然孕育于信息通信技术的日渐普及和成熟过程中,但它对社会经济生活产生的影响绝不限于技术层面。本质上,它为我们看待世界提供了一种全新的方法,即决策行为将日益基于数据分析做出,而不是像过去那样更多地凭借经验和直觉做出。数据挖掘是实现大数据知识发现的有效手段和途径,能帮助人们从海量数据中找到未知的、可能有用的、隐藏的规则,可以通过关联分析、聚类分析、时序分析等各种算法发现一些无法通过观察图表得出的深层次“知识”。关联规则作为数据挖掘领域中的一个主要研究内容,可以在不知道或无法确定数据的关联函数或模型时,有效发现大量数据项集之间有趣的关联信息,其已在零售、快消、电商、金融、搜索引擎、智能推荐等领域大有作为。自1993年Agrawal等人首先提出关联规则以来,关联规则的理论研究已经吸引了大量的国内外研究者。围绕关联规则的研究主要集中于两个方面:扩展经典关联规则能够解决问题的范围;改善经典关联规则挖掘算法效率和规则兴趣性。本书侧重于第二方面的研究内容。现有的关联规则挖掘算法因其时空复杂性和I/O代价高,难以适应大数据分析处理任务,利用集群系统、并行技术的强大数据处理能力,研究面向大数据的关联规则挖掘方法和性能优化,对于如今信息爆炸的大数据时代具有重要意义。

并行数据挖掘及性能优化——关联规则与数据相关性分析 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:并行数据挖掘及性能优化——关联规则与数据相关性分析