欢迎光临
免费的PDF电子书下载网站

高等学校大数据技术与应用规划教材:数据挖掘 PDF下载

编辑推荐

 ;  ;  ; 本书是基于人工智能和大数据及相关专业的新工科教材,重点介绍了数据挖掘领域具有代表性的概念和算法基础。全书侧重基本概念,并配有大量通俗易懂案例。本教材适合48学时、32学时的本科和专科教材,也可作为研究生的入门参考书。 ;

内容简介

 ;  ;  ; 本书着力于介绍数据挖掘基础知识、基本原理、常用算法,主要内容包括数据挖掘概述、数据的描述与可视化、数据的采集和预处理、数据的归约、关联规则挖掘、分类与预测、 非线性预测模型、聚类分析、深度学习简介、使用 Weka 进行数据挖掘。本书通俗易懂,注重基础知识、基本原理和基本方法,注重启发和引申,以培养学生独立思考和独立发现的能力。本书适合作为数据科学与大数据、信息管理、统计等专业的本科层次基础课教材,也可作为相关专业研究生层次的参考用书。

作者简介

 ;  ;  ;宋万清:上海工程技术大学电子电气工程学院教授,主要研究方向:状态监测与故障诊断,随机信号分析,大数据处理,机电一体化控制与现场总线技术。主讲了智能控制、系统辨识、数据挖掘等25门本科生与研究生课程。

高等学校大数据技术与应用规划教材:数据挖掘 PDF下载

目录

第 1 章数据挖掘概述 ...................... 1
1.1 什么是数据挖掘...................... 1
1.1.1 数据、信息和知识 ........ 1
1.1.2 数据挖掘的定义 ............2
1.1.3 数据挖掘的发展简史 .... 3
1.2 数据挖掘的基本流程
及方法概述 ............................. 4
1.2.1 数据挖掘的基本流程 .... 4
1.2.2 数据挖掘的任务
和方法概述 ................... 6
1.3 数据挖掘的应用...................... 9
1.3.1 数据挖掘在商务
领域的应用 ................... 9
1.3.2 数据挖掘在医疗

前沿

随着信息技术的普及和应用,各行各业产生了大量的数据,人们持续不断地探索

处理这些数据的方法,以期大程度地从中挖掘有用信息,面对如潮水般不断增加的

数据,人们不再满足于数据的查询和统计分析,而是期望从数据中提取信息或者知识

为决策服务。数据挖掘技术突破数据分析技术的种种局限,结合统计学、数据库、机

器学习等技术解决从数据中发现新的信息并辅助决策这一难题,是正在飞速发展的前

沿学科。近年来,随着教育部“新工科”建设的不断推进,大数据技术受到广泛的关

注,数据挖掘作为大数据技术的重要实现手段,能够挖掘数据的关联规则,实现数据

的分类、聚类、异常检测和时间序列分析等,解决商务管理、生产控制、市场分析、

工程设计和科学探索等各行各业中的数据分析与信息挖掘问题。

截至 2018 年本书出版,共有 283 所高校获批“数据科学与大数据技术”专业,

其中 985 及 211 高校占比为 13%。目前国内数据人才缺口更是达到百万级。数据科学

是一门交叉学科,除了计算机相关知识,还需要统计和数学基础,以及业务应用能力。

目前,数据科学与大数据逐渐成为高校信息类、管理类和数学统计类专业的必修课程,

同时,作为面向各专业的通识课也广受欢迎。

本书作为立足于应用型本科数据科学与大数据教学的入门级教材,具有如下特色:

(1)内容安排合理且全面,从数据的预处理到常用数据挖掘算法的描述,循序渐

进,深入浅出。

(2)难度适中,适用于本科中低年级的入门级教材,零基础要求,对编程及数学

知识不作要求。

(3)融入了大量本领域的前沿知识与方法,如包括基于 GAN 网络的深度学习的

新进展。

(4)理论与案例相结合,理论与实践相结合,包含了 Weka 工具的使用。特别地

在第 10 章还给出了完整的数据挖掘应用案例,使读者能够在数据挖掘平台上感受完

整的数据分析过程。

本书全面介绍了数据挖掘的基础知识、基本原理、 常用算法以及相应的实践工具,

主要内容分为以下四块内容:

(1)数据挖掘基本知识。第 1 章为数据挖掘概述,主要介绍数据挖掘的基本概念、

基本流程及算法等。第 2 章介绍数据的描述与可视化,包括数据按属性分类、数据的

基本统计描述、数据的相似性度量方法及数据的可视化技术等。

(2)数据预处理。第 3 章介绍数据的采集和预处理,包括数据的采集、数据预处

理的目的和任务、数据清洗、数据集成和数据变换等。第 4 章介绍数据的归约,包括

线性回归和主成分分析。

(3)数据挖掘算法详解。第 5 章介绍关联规则挖掘,包括关联规则挖掘的概念、

关联规则挖掘算法及应用实例。第 6 章介绍分类与预测,包括决策树模型、贝叶斯分数据挖掘

2

类模型、线性判别模型、逻辑回归模型以及模型的评估与选择方法。第 7 章介绍非线

性预测模型,包括支持向量机和神经网络。第 8 章介绍聚类分析,包括聚类分析概

述、 k-均值聚类、 k-中心聚类以及聚类评估。第 9 章介绍深度学习,包括深度学习

的来由、深度学习网络的基本结构、卷积神经网络及一个应用实例。

(4)数据挖掘实践。第 10 章为使用 Weka 进行数据挖掘,包括 Weka 的基本操作、

如何使用 Weka 进行关联规则挖掘、分类、回归和聚类等。

另外,附录还介绍了拉格朗日乘子法在支持向量机中的优化算法。

本书由宋万清、杨寿渊、陈剑雪、高永彬编著。具体分工如下:上海工程技术大

学宋万清编写第 2、5、6、8、10 章和附录,上海工程技术大学陈剑雪编写第 3、7 章,

上海工程技术大学高永彬编写第 9 章,江西财经大学杨寿渊编写第 1、4 章。全书由

上海工程技术大学方志军、上海交通大学钱亮宏主审。同时,本书部分内容借鉴了许

多学者的研究成果,在此深表谢意!

由于编者水平有限,加之时间仓促,书中难免存在疏漏和不足之处,敬请读者批

评指正。

编者

2018 年 8 月

高等学校大数据技术与应用规划教材:数据挖掘 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:高等学校大数据技术与应用规划教材:数据挖掘