欢迎光临
免费的PDF电子书下载网站

北京大学光华管理学院教材.商务统计系列—数据挖掘与应用 PDF下载

编辑推荐

  本书为北京大学光华管理学院教材。全书共分十章,主要内容包括数据理解和数据准备,多元统计中的降维方法,预测性建模的一些基本方法,神经网络,决策树,模型评估等。本书实例丰富,并附有相应SAS程序,以便于学生尽快理解相关内容并用以解决实际问题。  ;

内容简介

本书全面地介绍了数据挖掘的相关主题,包括数据理解与数据准备、关联规则挖掘、多元统计中的降维方法、聚类分析、神经网络、决策树方法、模型评估等内容。全书体系完整,文字精炼,注重对数据挖掘方法的直觉理解及其应用;同时,保持了一定的严谨性,为学生理解和运用这些方法提供了坚实的基础。

本书实例丰富,并附有相应SAS程序,以便于学生尽快理解相关内容并用以解决实际问题。

本书配有教辅,可以免费提供给任课教师使用。如需要,欢迎填写书后的“教师反馈及课件申请表”索取。

作者简介

张俊妮,美国哈佛大学统计学博士,现为北京大学光华管理学院商务统计及经济计量系副教授。研究领域包括因果推断、贝叶斯分析、蒙特卡洛方法、数据挖掘。

北京大学光华管理学院教材.商务统计系列—数据挖掘与应用 PDF下载

目录

第一章 数据挖掘概述
1.1 什么是数据挖掘
1.2 数据挖掘的应用
1.3 数据挖掘方法论
第二章 数据理解和数据准备
2.1 数据理解
2.2 数据准备
2.3 使用SAS进行数据理解和数据准备:FNBA信用卡数据
第三章 关联规则挖掘
3.1 关联规则的实际意义
3.2 关联规则的基本概念及Apriori算法
3.3 负关联规则
3.4 序列关联规则
3.5 使用SAS进行关联规则挖掘
第四章 多元统计中的降维方法
4.1 主成分分析
4.2 探索性因子分析
4.3 多维标度分析
第五章 聚类分析
5.1 距离与相似度的度量
5.2 k均值聚类法
5.3 层次聚类法
第六章 预测性建模的一些基本方法
6.1 判别分析
6.2 朴素贝叶斯分类算法
6.3 k近邻法
6.4 线性模型与广义线性模型
第七章 神经网络
7.1 神经网络架构及基本组成
7.2 误差函数
7.3 神经网络训练算法
7.4 提高神经网络模型的可推广性
7.5 数据预处理
7.6 使用SAS建立神经网络模型
7.7 自组织图
第八章 决策树
8.1 决策树简介
8.2 决策树的生长与修剪
8.3 对缺失数据的处理
8.4 变量选择
8.5 决策树的优缺点
第九章 模型评估
9.1 因变量为二分变量的情形
9.2 因变量为多分变量的情形
9.3 因变量为连续变量的情形
9.4 使用SAS评估模型
第十章 模型组合与两阶段模型
10.1 模型组合
10.2 随机森林
10.3 两阶段模型
参考文献

免费在线读

第一章 数据挖掘概述

1.1 什么是数据挖掘

任何一个组织(政府部门、企业、学校等)在决策与运营活动中都会积累丰富的经验,同时也面临着在不断变化的环境下做出快速而正确决策的挑战。数据挖掘方法首先把组织所积累的经验转换为可度量的数据,对其进行分析后,提炼出对运营管理有指导意义的新知识,进一步改进决策、改善运营活动(见图1.1)。这是一个持续改进的过程,决策经营活动不断积累新的经验、新的数据,使用数据挖掘方法分析新的数据后不断产生新的知识,不断地促进决策与经营活动的改进和完善。Berry和Linoff(2000)将数据挖掘定义为对大量数据进行探索和分析、以便发现有意义的模式和规则的过程。

  1.2 数据挖掘的应用

数据挖掘在很多领域都得到了广泛应用,以客户为导向的应用有市场篮分析、获取客户、客户细分、客户保持、交叉销售、向上销售、客户终身价值分析等,以运营为导向的应用有盈利分析、定价、欺诈发现、风险评估、雇员流失分析、生产效率分析等。下面我们从几个具体的案例来看数据挖掘的应用。

  ……

北京大学光华管理学院教材.商务统计系列—数据挖掘与应用 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:北京大学光华管理学院教材.商务统计系列—数据挖掘与应用