编辑推荐
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编著而成。书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。最后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。
 ;
内容简介
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编写而成,书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。最后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。
本书可供从事数据挖掘、机器学习与知识工程领域的科学工作者、相关专业的本科生和研究生,以及从事数据分析和处理的工程技术人员参考。
作者简介
暂无
目录
第1章引言1
1.1研究背景与意义1
1.2本书的主要内容与组织结构3
1.3研究方法与技术路线6第2章相关理论基础7
2.1数据挖掘7
2.1.1基本理论、模型和算法8
2.1.2针对异构数据的方法及应用11
2.1.3性能评价方法12
2.1.4实际应用12
2.1.5其他方面14
2.2最优化理论16
2.2.1经典优化理论、方法和应用16
2.2.2启发式优化方法18
2.2.3全局优化及国内的优化研究19
2.3分类问题20
2.3.1分类器方法20
2.3.2分类性能的提升23
2.3.3分类结果评价23
2.4最优化分类方法24
2.4.1支持向量机分类方法24
2.4.2数学规划分类方法26
2.5数据的不确定性27
2.5.1数据的不确定性概述27
2.5.2不确定性的研究现状29
2.6不确定理论30
2.6.1不确定理论综述30
2.6.2模糊集与模糊规划32
2.6.3粗糙集与粗规划33
2.7数据挖掘方法的近似性和多目标性34
2.8小结35第3章多目标优化分类模型36
3.1分类问题的表示与评价36
3.1.1分类问题的表示36
3.1.2分类性能评价37
3.2支持向量机分类模型40
3.2.1支持向量机分类模型概述40
3.2.2最小二乘支持向量机分类模型44
3.3多目标优化分类模型概述46
3.3.1多目标决策概述47
3.3.2多目标优化分类模型49
3.3.3多目标线性规划分类模型55
3.3.4多目标二次规划分类模型59
3.4MCO和SVM分类模型的关系分析64
3.5小结66第4章模糊多目标规划分类模型和算法67
4.1模糊集基本理论67
4.2模糊多目标线性规划分类模型和算法70
4.2.1模糊决策和模糊线性规划70
4.2.2模糊多目标线性规划分类模型72
4.2.3模糊多目标线性规划分类算法79
4.2.4与多阶段模糊线性规划分类方法的对比分析82
4.3模糊多目标二次规划分类模型85
4.3.1模糊二次规划85
4.3.2模糊多目标二次规划分类模型86
4.4小结90第5章基于粗糙集的特征选择与多目标规划分类模型和算法91
5.1特征选择和约简方法91
5.1.1特征选择和属性约简基本理论91
5.1.2基于统计属性贡献度的约简方法93
5.2基于粗糙集的约简方法96
5.2.1基于等价关系的粗集约简方法97
5.2.2基于不可分辨关系的粗集整数规划约简模型100
5.3基于粗糙集的多目标规划分类模型和算法103
5.3.1基于粗糙集的多目标规划分类模型104
5.3.2基于粗糙集的多目标规划分类算法106
5.4粗糙集近似理论107
5.5粗近似多目标规划分类模型109
5.5.1粗近似多目标线性规划分类模型112
5.5.2粗近似多目标二次规划分类模型113
5.6小结115第6章基于核、模糊化和惩罚因子的多目标优化分类模型117
6.1不确定现象概述117
6.2模糊支持向量机分类模型122
6.3基于核、模糊化和惩罚因子的多目标优化分类模型125
6.3.1基于核与惩罚因子的模糊多目标优化分类模型125
6.3.2基于模糊化和惩罚因子的核多目标优化分类模型130
6.4小结133第7章不确定性多目标优化分类模型的应用135
7.1信用评分135
7.1.1信用评分及相关方法概述135
7.1.2信用评分流程139
7.1.3信用评分数据集141
7.1.4信用评分实例分析142
7.2Web客户忠诚度分析157
7.2.1Web挖掘概述157
7.2.2Web客户忠诚度分析数据集158
7.2.3性能分析160
7.2.4Web客户忠诚度分析161
7.3蛋白质交互的热点区域的预测165
7.3.1概述165
7.3.2蛋白质交互的热点区域预测数据集166
7.3.3蛋白质交互的热点区域分析166
7.4重大疾病的医疗诊断和预测170
7.4.1数据概述170
7.4.2重大疾病的医疗诊断和预测分析171
7.5小结175第8章总结与展望176
8.1研究总结176
8.2主要贡献177
8.3对后续研究工作的展望178参考文献180
媒体评论
评论
前沿
数据挖掘是从海量数据中发现并提取隐藏的、前所未知的、有价值的信息或知识,然后利用这些信息或知识辅助做出重要决策的过程。因此,分析数据库、数据集市和数据仓库中收集的历史数据能够帮助商业决策者更好地了解他们的客户、提升产品或服务的质量、评价企业在市场中的地位、提高和改进决策的准确性和增加其竞争力。随着理论研究的不断深入和大量的实际应用的推广,数据挖掘的方法逐渐发展成为一门新的学科和技术,它主要包括最近邻算法、贝叶斯分类器、决策树、神经网络、数学规划、模糊集、粗糙集和支持向量机等方法。
然而,某些现有的确定性数据挖掘方法和模型在解决实际问题时又存在各种各样的局限性,特别是当数据中存在不确定、不精确、不一致、不完整等数据或信息时,这些方法和模型的性能表现较差,有时甚至无法有效地得到所求问题的解。因此,本书在深入研究模糊集、粗糙集和核方法等不确定理论、多目标规划和决策以及分类问题等的基础上,尤其是在客观地分析了这些方法之间存在的互补性的前提下,提出了建立一系列不确定性多目标优化的模型和算法,并将它们主要用于解决数据挖掘中的分类问题,以提高分类的准确性、分类模型和算法的求解效率,以及它们在新数据上的泛化能力。
因此,本书主要探讨了不确定情形的多目标优化分类器的各种模型和算法,包括模糊多目标规划分类器、基于粗糙集预处理的多目标规划分类器和粗近似多目标规划分类器的各种新的模型及算法流程。此外,在全面分析传统的特征选择方法存在的不足的情形下,提出基于统计属性贡献度的特征选择模型和算法;然后,本书分析了粗糙集在属性和信息约简方面的优势,同时,又由于一般的粗糙集方法本身存在缺点,所以在描述的基础上给出了一种扩展的、基于粗糙集理论的属性约简模型和算法,综合考虑了粗糙集的代数和逻辑方法。针对数据中广泛存在的噪声、异常、类别不平衡和非线性可分的情形,提出一类基于核方法、模糊化和惩罚因子的多目标优化的分类模型和算法,并将这类新的分类/不确定性多目标优化的数据挖掘理论及应用前言/模型和算法用于客户信用评分、蛋白质交互的热点区域的预测以及重大疾病的医疗诊断和预测。
总之,通过信用评分、Web客户关系分析、蛋白质交互的热点区域的预测和重大疾病的医疗诊断及预测等的实际应用,将其分类结果与传统方法对比分析的结论表明,不确定性多目标规划分类方法能够显著地提高分类的性能,模型运行的效率,对不同类型数据的适应性、稳定性和灵活性以及它们在新数据集上的推广能力。对于商业应用而言,上述各种模型和算法能够较好地改进和提高商业决策的质量和效益。
由于作者水平有限,书中难免会有错误和不妥之处,恳请广大读者批评指正。
本著作的出版得到国家自然科学基金(No.61170161)和山东省自然科学基金(No.ZR2012FL13)的资助。感谢清华大学出版社的大力支持。
 ;
作者2015年6月
不确定性多目标优化的数据挖掘理论及应用 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版