欢迎光临
免费的PDF电子书下载网站

数据挖掘与知识发现 PDF下载

编辑推荐

本书不再重印或换新版。 ;

内容简介

本书详尽地阐述了数据挖掘与知识发现领域中的一些基本理论和研究方法。介绍了KDD与数据挖掘的概念、数据挖掘对象、知识发现过程、研究方法以及相关研究领域和应用范围。作为知识发现的数据预处理工作,简要叙述了数据清理、数据约简、数据概念等级分层、多维数据模型等内容。书中较详细地介绍了粗糙级、模糊集、聚类分析、关联规则、人工神经网络、分类与预测等数据挖掘方法,最后还简要介绍了多媒体数据挖掘工作的有关进展。

   本书可以作为计算机科学与技术专业和信息科学方向高年级本科生和研究生的教材或参考书,也可供有关科技人员学习参考。

作者简介

暂无

数据挖掘与知识发现 PDF下载

目录

第一章 绪论
1.1 引言
1.2 KDD与数据挖掘
1.2.1 KDD定义
1.2.2 KDD过程
1.2.3 数据库技术发展与数据挖掘
1.3 数据挖掘的对象与环境
1.3.1 数据与系统特征
1.3.2 数据结构
1.3.3 数据库系统
1.4 数据挖掘方法与相关领域
1.4.1 数据挖掘相关领域
1.4.2 粗糙集
1.4.3 聚类
1.4.4 关联规则
1.4.5 决策树
1.4.6 模糊集
1.4.7 规则归纳
1.4.8 进化计算
1.5 KDD系统与应用
本章小结
习题一
第二章 数据预处理与数据仓库
2.1 数据清理
2.1.1 填补空缺值
2.1.2 消除噪声数据
2.1.3 实现数据一致性
2.2 数据集成与转换
2.2.1 数据集成
 2.2.2 数据转换
 2.3 数据归约与浓缩
 2.3.1 数据立方体聚集
  2.3.2 维归约
 2.3.3 数据压缩
  2.3.4 数值归约
 2.4 概念分层
 2.4.1 概念分层的概念
  2.4.2 概念分层的类型
  2.4.3 数值数据的概念分层与离散化
  2.4.4 分类数据的概念分层
 2.5 数据仓库与多维数据模型
  2.5.1 数据仓库的概念
  2.5.2 数据仓库中的数据组织
  2.5.3 数据立方体
  2.5.4 多维数据库模式
 2.6 数据仓库与数据挖掘
  2.6.1 数据仓库应用
  2.6.2 数据挖掘和数据仓库的关系
 本章小结
 习题二
第三章 粗糙集
3.1 近似空间
3.1.1 近似空间与不可分辨关系
3.1.2 知识与知识库
3.2 近似与粗糙集
3.2.1 近似与粗糙集的基本概念
3.2.2 粗糙集的基本性质
3.3 粗糙集的特征描述
3.3.1 近似精度
 ……
第四章 模糊集
第五章 聚类分析
第六章 关联规则
第七章 人工神经网络
第八章 分类与预测
第九章 多媒体数据挖掘
参考文献
名词索引

免费在线读

第一章 绪论

  1.1 引言

  科技的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据库管理系统的应用领域越来越广泛。条形码和信用卡的普及和使用,进一步加速了商业、金融、保险等领域的信息化进程。人们已经利用计算机取代了绝大部分手工操作。超级市场中的交易数据,油站里的油料购买数据,旅行社中的旅行信息数据等均是数据库系统的信息来源。最近十几年中,数据库中存储的数据量急剧增大。例如,NASA轨道卫星上的地球观测系统EOS每小时会向地面发回50 GB的图像数据;世界上最大的数据仓库之一,美国零售商系统Wal-Mart每天会产生2亿左右的交易数据;人类基因组数据库项目已经搜集了数以GB计的人类基因编码数据等。如此多领域的数据各自存放在相应的数据库中,致使数据库的规模日益扩大,已经达到数十兆字节,有的甚至更大。与此同时,大容量、高速度、低价格的存储设备也相继问世,管理大量数据的数据库管理系统以及各类数据仓库已经能够支持存储、检索如此规模的数据。但目前数据库系统所能做到的只是对数据库中已有的数据进行存取,通过这些数据获得的信息量仅占整个数据库信息量的一小部分,因为用来对这些数据进行分析处理的工具很少,而且有局限性。在信息时代,大量信息在给人们带来方便的同时,也带来了一系列问题,比如,信息量过大,超过了人们掌握、消化的能力;一些信息真伪难辨,给信息的正确运用带来困难;网络上的信息安全难以保障;信息组织形式的不一致性,增加了对信息进行有效统一处理的难度等。另一方面,人们意识到隐藏在这些数据之后的更深层次、更重要的信息能够描述数据的整体特征,可以预测发展趋势,这些信息在决策生成的过程中具有重要的参考价值。面对海量数据库和大量繁杂信息,如何才能从中提取有价值的知识,进一步提高信息的利用率,由此引发了一个新的研究方向:基于数据库的知识发现(Knowledge Discovery in Database)及相应的数据挖掘(Data Mining)理论和技术的研究。

  基于数据库的知识发现(KDD)一词首次出现在1989年举行的第十一届AAAI学术会议上,其后,在VLDB(Very Large Database)及其他与数据库领域相关的国际学术会议上也举行了KDD专题研讨会。l995年在加拿大蒙特利尔召开了第一届KDD国际学术会议(KDD’95),随后,每年召开一次这样的会议。由Kluwer Academic Publishers出版,1997年创刊的《Knowledge Discovery and Data Mining》是该领域中的第一本学术刊物。

 ……

数据挖掘与知识发现 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:数据挖掘与知识发现