欢迎光临
免费的PDF电子书下载网站

R语言数据挖掘(第2版)(21世纪统计学系列教材) PDF下载

编辑推荐

暂无

内容简介

数据挖掘,继承和发展经典统计分析的理论成果,结合现代机器学习方法,借助大规模高性能计算不断逼近大数据规律真相,突破了传统数据分析方法的大数据应用局限;R语言,以其开源性、易用性、全面性、前沿性和可扩充性,是实现大数据分析实践的有效工具。《R语言数据挖掘》努力坚持:讲明白理论原理,讲明白案例问题,讲明白实现步骤,讲明白结果含义的写作风格,围绕大数据分析的四大核心问题:建立数据预测模型,揭示数据内在结构,探究数据关联性,诊断异常数据,以应用案例为线索,深入浅出地讨论了众多经典数据挖掘方法原理,完整详细地讲解了R语言实现过程。本书可作为高等院校统计学、数据科学和大数据技术、大数据管理等相关专业本科生和研究生数据挖掘、机器学习和其他数据分析课程的教材,也可作为科研机构、政府和企业经营管理部门等研究人员参考用书。

作者简介

薛薇,中国人民大学应用统计中心副主任,中国人民大学统计学院副教授。主要研究领域:数据挖掘、文本挖掘、复杂网络建模。关注统计和数据挖掘算法及软件应用,统计数据库系统研发等方面。涉足交通、金融、贸易等复杂网络动态建模,电商数据分析,网络新媒体舆论传播、热点事件主题跟踪和预测建模,政府和官方微博、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。

R语言数据挖掘(第2版)(21世纪统计学系列教材) PDF下载

目录

第1章数据挖掘与R语言概述
1.1什么是数据挖掘
1.2数据挖掘的结果
1.3数据挖掘能做什么
1.4数据挖掘方法的特点
1.5数据挖掘的典型应用
1.6R语言入门必备
1.7RStudio简介
1.8本章函数列表

第2章R的数据组织和整理
2.1R的数据对象
2.2向量的创建和访问
2.3矩阵的创建和访问
2.4数据框的创建和访问
2.5数组和列表的创建和访问
2.6数据对象的相互转换
2.7导入外部数据和保存数据
2.8R语言程序设计基础
2.9R语言数据整理和程序设计综合应用
2.10本章函数列表

第3章R的数据可视化
3.1绘图基础
3.2单变量分布特征的可视化
3.3多变量联合分布特征的可视化
3.4变量间相关性的可视化
3.5GIS数据的可视化
3.6文本词频数据的可视化
3.7本章函数列表

第4章R的近邻分析:数据预测
4.1近邻分析:K近邻法
4.2基于变量重要性的加权K近邻法
4.3基于观测相似性的加权K近邻法
4.4本章函数列表

第5章R的决策树:数据预测
5.1决策树算法概述
5.2分类回归树的生长过程
5.3分类回归树的剪枝
5.4分类回归树的R函数和应用示例
5.5建立分类回归树的组合预测模型
5.6随机森林
5.7本章函数列表

第6章R的人工神经网络:数据预测
6.1人工神经网络概述
6.2BP反向传播网络
6.3BP反向传播网络的R函数和应用示例
6.4本章函数列表

第7章R的支持向量机:数据预测
7.1支持向量分类概述
7.2线性可分问题下的支持向量分类
7.3广义线性可分问题下的支持向量分类
7.4线性不可分问题下的支持向量分类
7.5多分类的支持向量分类
7.6支持向量回归
7.7R的支持向量机及应用示例
7.8本章函数列表

第8章R的一般聚类:揭示数据内在结构
8.1聚类分析概述
8.2基于质心的聚类模型:KMeans聚类
8.3基于质心的聚类模型:PAM聚类
8.4基于联通性的聚类模型:层次聚类
8.5基于统计分布的聚类模型:EM聚类
8.6本章函数列表

第9章R的特色聚类:揭示数据内在结构
9.1BIRCH聚类
9.2SOM网络聚类
9.3基于密度的聚类模型:DBSCAN聚类
9.4本章函数列表

第10章R的关联分析:揭示数据关联性
10.1简单关联规则及其测度
10.2Apriori算法及应用示例
10.3Eclat算法及应用示例
10.4简单关联分析的应用示例
10.5序列关联分析及SPADE算法
10.6本章函数列表

第11章R的模式甄别:诊断异常数据
11.1模式甄别方法和评价概述
11.2模式甄别的无监督侦测方法及应用示例
11.3模式甄别的有监督侦测方法及应用示例
11.4模式甄别的半监督侦测方法及应用示例
11.5本章函数列表

第12章R的网络分析初步
12.1网络的定义、表示及构建
12.2网络节点重要性的测度
12.3网络子群构成特征研究
12.4网络整体特征刻画
12.5主要网络类型及特点
12.6本章函数列表R语言数据挖掘

免费在线读

《R语言数据挖掘》(第2版)仍然坚持第1版原理讲解深入浅出,案例代码可反复实现,兼顾数据挖掘原理和实践,手把手教会读者数据挖掘的风格。同时,在第1版的基础上进行了以下修订:

第一,在保持内容框架不变的基础上,对各章节文字进行了全面梳理和规范,使得全书通篇文字表述更加一致、完整和严谨。

第二,为使读者更易理解原理,对第4章加权K近邻法的距离和相似度变换过程进行了更加详尽的讲解,调整了旁置法的表述;调整了第5章分类树生长过程异质性下降测度公式的书写形式,更加详尽地论述了对交叉验证的剪枝过程,增加了对随机森林输出结果的说明;统一了神经网络中权值、误差的数学书写;对EM聚类过程进行了更加详尽的讲解。

第三,增加了Rstudio简介。

本书可作为高等院校数据科学和大数据技术本科专业,以及其他相关专业本科生和研究生的学习教材,同时也可作为商业企业、科研机构、政府管理部门等相关数据分析人员的阅读参考书。请读者到中国人民大学经管图书在线(http://www.rdjg.com.cn)网站,下载本书案例数据和R程序代码。

特别感谢中国人民大学出版社对本书出版的大力支持,感谢王珏、刘茜、王艳红、周天旺、要卓、陈笑语等同学对本书的贡献。书中不妥和错误之处,望读者不吝指正。

R语言数据挖掘(第2版)(21世纪统计学系列教材) pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:R语言数据挖掘(第2版)(21世纪统计学系列教材)