欢迎光临
免费的PDF电子书下载网站

CDA数据分析师系列丛书 如虎添翼!数据处理的SAS EG实现 PDF下载

编辑推荐

CDA数据分析师系列丛书按照数据分析师规范化学习体系而定,对于一名初学者,应该先掌握必要的概率、统计理论基础,包括描述性分析,推断性分析,参数估计,假设检验,方差分析,回归分析等内容,这在本《从零进阶!数据分析的统计基础》中进行了专业详细的讲解。其次,数据分析需要按照标准流程进行,即数据的获取、储存、整理、清洗、归约等系列数据处理技术,这在《如虎添翼!数据处理的SAS EG实现》中利用SAS EG和编程技术进行了操作过程的详解。经过处理的数据需要根据业务问题,利用相关方法进行建模分析,得出结果,结果检验,绘制图表并解读数据,这在《胸有成竹!数据分析的SAS EG进阶》中进行了详细的讲解和操作分析。

CDA数据分析师丛书整体风格是“理论>;技术>;应用”的一个学习过程,目的在于商业业务应用、职场数据分析,为欲从事于数据分析领域的各界人士提供了一个规范化数据分析师的学习体系。

 ;

内容简介

《如虎添翼!数据处理的SAS EG实现》作为SAS EG模块的中文教材,并非单纯的逐个讲解菜单的操作,而是将数据分析的基本思路、流程融入到软件的操作之中。每章通过设置商业背景,配以SAS理论的讲解形式更贴近读者的实际工作,使读者真正理解数据分析、数据处理的精髓。本书除讲解软件操作,还同时介绍了对应菜单操作的SAS程序语言实现过程,读者可以根据自己的需要逐步学习,进而走进用SAS程序处理数据的大门。

《如虎添翼!数据处理的SAS EG实现》适合那些想了解数据预处理,或者被数据的预处理占去大部分时间而想提高效率,或者囿于菜单操作的局限性而希望通过程序实现的数据分析人员。

作者简介

人大经济论坛:于2003年成立,致力于推动经管学科的进步,传播优秀教育资源,目前已经发展成为国内的经济、管理、金融、统计类的在线教育和咨询网站,也是国内最活跃和影响力的经管类网络社区。

人大经济论坛从2006年起在国内最早开展数据分析培训,累计培训学员数万人,在大数据的趋势背景下,作为Certified Data Analyst Institute(注册数据分析师协会,简称CDA协会)的中国唯一授权中心,根据CDA协会的数据分析师LevelⅠ(业务分析师)、Level Ⅱ(建模分析师)、Level Ⅲ(数据专家)的等级标准,致力于培养正规化、科学化、专业化的数据分析师队伍,为企事业单位输送更多优秀数据分析人才。(Certified Data Analyst Institute,亦称“注册数据分析师协会”,成立于美国特拉华州,主要宗旨为汇聚国际先进的数据分析技术,建设国际性规范化数据分析师职业标准,推进数据分析师的行业发展及认证工作,目前标准行业认证为CDA数据分析师)

徐筱刚,统计学硕士。拥有近十年的丰富的数据分析、数据挖掘实战经验,曾就职于咨询公司、金融机构等多家著名企业,目前在一家金融机构担任资深数据分析顾问,具有零售、电信、金融等多个数据挖掘的项目经验和行业背景。

CDA数据分析师系列丛书 如虎添翼!数据处理的SAS EG实现 PDF下载

目录

第1章 软件入门介绍
1.1 SASEG介绍
1.1.1 SASEG简介
1.1.2 SASEG的窗口及菜单
1.2 数据挖掘的流程介绍
1.2.1 KDD介绍
1.2.2 CRISP-DM
1.2.3 SEMMA
1.2.4 三种数据挖掘流程的比较
第2章 使用数据
2.1 通过SAS逻辑库访问数据
2.1.1 商业背景
2.1.2 SAS相关功能介绍
2.1.3 EG菜单解决方案
2.1.4 程序实现
2.2 理解SAS数据集的定义
2.2.1 理解SAS数据集的含义
2.2.2 商业背景
2.2.3 SAS相关功能介绍
2.2.3 EG菜单解决方案
2.2.4 程序实现
2.3 导入其他格式的数据文件
2.3.1 商业背景
2.3.2 SAS相关功能介绍
2.3.3 EG菜单解决方案
2.3.4 程序实现
2.4 扩展阅读
第3章 探索性数据分析及数据的清理
3.1 探索性数据分析
3.1.1 基本理论讲解
3.1.2 EG菜单解决方案
3.2 数据清理介绍
3.2.1 商业背景
3.2.2 需要清理的数据类型
3.3 类别变量的清理
3.3.1 EG菜单解决方案
3.3.2 类别变量的清理
3.4 数值型变量的清理
3.4.1 EG菜单解决方案
3.4.2 程序实现
3.5 正态分布的验证
3.5.1 商业背景
3.5.2 相关理论介绍
3.5.3 EG菜单解决方案
3.5.4 程序实现
3.6 扩展阅读
第4章 数据的行处理
4.1 数据筛选
4.1.1 商业背景
4.1.2 相关理论介绍
4.1.3 EG菜单解决方案
4.1.4 程序实现
4.2 排序与求秩
4.2.1 商业背景
4.2.2 理论介绍
4.2.3 菜单解决方案
4.2.4 EG菜单解决方案-求秩
4.2.5 程序实现
4.3 抽样
4.3.1 商业背景
4.3.2 抽样理论介绍
4.3.3 EG菜单解决方案
4.3.4 程序实现
4.4 数据分组和汇总
4.4.1 商业背景
4.4.2 EG菜单解决方案
4.4.3 程序实现
4.5 扩展阅读
第5章 数据的列处理
5.1 计算新变量
5.1.1 商业背景
5.1.2 EG菜单解决方案
5.2 拆分列
5.2.1 商业背景
5.2.2 EG菜单解决方案
5.3 堆叠列
5.3.1 商业背景
5.3.2 EG菜单解决方案
5.4 转置列
5.4.1 商业背景
5.4.2 EG菜单解决方案
5.4.3 程序实现
5.5 函数及运算符的使用
5.5.1 运算符
5.5.2 函数
5.6 对列重编码
5.6.1 商业背景介绍
5.6.2 EG菜单解决方案
5.6.3 程序实现
5.7 标准化
5.7.1 商业背景
5.7.2 相关理论介绍
5.7.3 EG菜单实现
5.7.4 实现程序
5.8 扩展阅读
第6章 数据集的操作
6.1 纵向连接
6.1.1 商业背景
6.1.2 相关的理论
6.1.3 EG菜单解决方案
6.1.4 程序实现
6.2 横向连接
6.2.1 商业背景
6.2.2 相关理论介绍
6.2.3 EG菜单解决方案
6.2.4 程序实现
6.3 数据集的比较
6.3.1 商业背景介绍
6.3.2 相关理论介绍
6.3.3 EG菜单解决方案
6.3.4 程序实现
6.4 创建格式
6.4.1 商业背景
6.4.2 相关理论介绍
6.4.3 EG菜单解决方案
6.4.4 程序实现
6.5 删除数据集和格式
 ;6.5.1 EG菜单解决方案
6.5.2 程序实现
6.6 扩展阅读
第7章 数据的展示:图形及报告的编制
7.1 数据可视化与图表
7.1.1 商业背景
7.1.2 相关理论介绍
7.1.3 EG菜单解决方案
7.2 创建Listing报表
7.2.1 商业背景
7.2.2 相关理论介绍
7.2.3 EG菜单解决方案
7.2.4 程序实现
7.3 扩展阅读
第8章 在SASEG中使用提示和条件处理
8.1 提示与宏变量
8.1.1 商业背景
8.1.2 相关的理论介绍
8.1.3 EG菜单解决方案
8.2 条件处理
8.2.1 商业背景
8.2.2 EG菜单解决方案
8.3 扩展阅读
第9章 在SASEG中使用程序
9.1 如何在SASEG中使用程序
9.2 SAS程序
9.2.1 SAS语言元素
9.2.2 DATA步
9.2.3 PROC步
9.2.4 SAS的模块介绍
9.3 扩展阅读
附录A 菜单对应关系附录B CDA(注册数据分析师)致力于最好的数据分析人才建设
参考文献

前沿

序言:这是一个用数据说话的时代

  在 CDA(注册数据分析师)Level I 级教材付诸印刷之际,关于数据分析这个职业及其价值的报 道就有很多。比如,下面两条报道就充分体现了在大数据时代下,数据分析的价值。这在以前是从来 没有过的。
  LinkedIn 的最新投票结果显示,‘统计分析和数据挖掘’是 2014 年最大的求职法宝。LinkedIn 对 全球超过 3.3 亿用户的工作经历和技能进行分析,公布 2014 年最受雇主喜欢、最炙手可热的 25 项技 能,其中位列榜首的是统计分析和数据挖掘。
  麦肯锡公司的一份研究预测称,到 2018 年,在“具有深入分析能力的人才”方面,美国可能面临 着 14 万到 19 万人的缺口,而“可以利用大数据分析来做出有效决策的经理和分析师” 缺口则会达到
  150 万人。数据科学家将成为 2015 年最热门的职业。
  早在 2010 年 2 月,肯尼斯库克尔在《经济学人》上发表了一份关于管理信息的特别报告——《数 据,无所不在的数据》,文中写道:“世界上有着无法想象的巨量数字信息,并以极快的速度增长……
  从经济界到科学界,从政府部门到艺术领域,很多地方都已感受到了这种巨量信息的影响。”2011 年, 麦肯锡发布了《大数据:下一个具有创新力、竞争力与生产力的前沿领域》,使人们在这篇文章里认识
  到了数据的力量。于是,一夜之间,面向数据分析市场的新产品、新技术、新服务、新业态正在不断 涌现。从个人、企业到国家层面,都把数据作为一种重要的战略资产,逐渐认识到了数据的价值,不 同程度地渗透到每个行业领域和部门,大大提升了企业的经营利润,推动了经济的发展。
  这是一个用数据说话的时代,也是一个依靠数据竞争的时代。目前世界 500 强企业中,有 90%以 上都建立了数据分析部门。IBM、微软、Google 等知名公司都积极投资数据业务,建立数据部门,培养数据分析团队。各国政府和越来越多的企业意识到数据和信息已经成为企业的智力资产和资源,数据的分析和处理能力正在成为日益倚重的技术手段。 作为一个数学和统计学的强国,数据分析、数据挖掘和大数据价值挖掘行业在我国仍属于朝阳行业,数据分析人才仍然比较稀缺。各行各业在平常工作中积累的各种各样的数据分析问题仍然没有得 到及时有效地解决,有些问题,还是关乎本行业发展的至关重要的问题。数据积累越来越多,期待解 决分析的数据问题也越来越多,人们逐渐习惯使用数据作为决策的重要参考依据。据艾瑞的研究报告,未来与数据分析相关的就业岗位会在 1000 万人左右,而目前来说国内合格的数据分析师不足 5 万人, 建立一个科学有效的数据分析师培训体系迫在眉睫。
  在这样一个用数据说话的时代,积累了丰富的数据分析培训经验的人大经济论坛承担起使命,几番调查研究,几番反复推演论证,在 2013 年,这个大数据的“元年”,CDA 注册数据分析师应运而生!
  2003 年,人大经济论坛依托中国人民大学成立,在金融、管理、统计领域已积淀 11 个年头,在国内享有良好声誉。
  2006 年,人大经济论坛数据分析培训中心设立,至今经历 8 个春秋,建立了大陆、台湾一线师资 团队,培养人才已达 3 万余人。
  2013 年,“中国数据挖掘与数据分析俱乐部 CDMC”在人大经济论坛旗下成立,2014 年改名为 “CDA 数据分析师俱乐部”。来自政府、金融、电信、零售、电商、互联网、教育等行业人士加入会员, 成功举办了数十场行业聚会。紧接着,积累了数据分析培训丰富经验的人大经济论坛在国内展开 CDA 数据分析师系统培训和认证考试,成功见证了 1000 余名数据分析师的成长。
  2015 年,人大经济论坛将提供高水平、多层次的数据分析培训服务,以在行业积累 多年的影响 力,吸引更好更多的优秀师资,瞄准行业内重要的数据分析问题和难点,攻坚突破,建立更加规范的行业培训体系,引领数据分析培训行业向规范化、有效化和前瞻化方向发展,为数据分析培训做出应 有的贡献。
  其实,数学(含统计)和英语一样重要,都是人们不可或缺的重要技能。既然英语全民这么重视, 数学及其数据分析的技能更加需求于方方面面,更应被做大做强。让我们共同期待人大经济论坛办成 另一个数据的“新东方”!
  覃智勇
  2015 年 1 月 1 日
  前言
  感谢您选择“CDA数据分析师”Level I学习系列丛书之《如虎添翼!数据处理的SAS EG实现》。
  该丛书按照数据分析师规范化学习体系而定,对于一名初学者,应该先掌握必要的概率、统计理论基础,包括描述性分析、推断性分析、参数估计、假设检验、方差分析、回归分析等内容,这在第一本书《从零进阶!数据分析的统计基础》中进行了专业详细的讲解。其次,数据分析需要按照标准流程进行,即数据的获取、储存、整理、清洗、归约等系列数据处理技术,这在《如虎添翼!数据处理的SAS EG实现》中利用SAS EG和编程技术进行了操作过程的详解。最后,经过处理的数据需要根据业务问题,利用相关方法进行建模分析,得出结果,结果检验,绘制图表并解读数据,这在《胸有成竹!数据分析的SAS EG进阶》中进行了详细的讲解和操作分析。
  CDA数据分析师丛书整体风格是“理论>技术>应用”的一个学习过程,最终目的在于商业业务应用、职场数据分析,为欲从事于数据分析领域的各界人士提供了一个规范化数据分析师的学习体系。
  读者对象
  作为丛书中的一本,本书上承基础理论部分,下启最终建模及案例分析。本书将关注点集中到数据的探索及预处理上,通过本书的学习将会加深对基础理论部分的理解,为后续的建模分析做好数据上的准备。本书适合那些想了解数据预处理,或者被数据的预处理占去大部分时间而想提高效率,或者囿于菜单操作的局限性而希望通过程序实现的数据分析人员。
  阅读指南
  对数据分析师而言,合适的数据就像好的食材,对最终分析结果的影响不言而喻,但是在日常的工作中我们会经常遇到两个问题,一是数据的质量不高,数据在收集、存储等过程中不可避免地出现了脏数据、不一致数据、噪声数据、重复数据等,如果我们不做任何预处理而直接输入模型,就会出现“garbage in, garbage out”,即垃圾进垃圾出的情况。二是数据的形式不符,因为不同的模型,建模技术都有一定的前提假设,对数据的展现形式、分布状态等都有较为严格的要求,如果不做预处理,模型出来的结果很可能与数据底层真正蕴含的规律背道而驰,对这种形式的数据盲目地进行建模分析,极容易误人误己。
  数据预处理占到整个数据挖掘的60%~80%的时间,要想高效正确地完成数据的预处理工作其实不是一件容易的事情,本书作者根据在咨询公司、电信及金融行业的多年经验,将常用的数据预处理思路融入到SAS EG的菜单操作中,并配以SAS程序的讲解,使得读者在熟悉菜单的同时,能用简单的SAS语言完成相对复杂的数据处理要求。
  全书共分为九章:
  第1章介绍了SAS EG软件,并介绍了三种常见的数据分析流程;
  第2章介绍了如何通过多种方式使SAS EG可以轻松地访问多种形式的外部数据;、
  第3章介绍了探索性数据分析的基本思路,以及数据清理的相关理论,并分别演示了如何对类别数据、数据数据进行清理;
  第4章、第5章介绍了如何对数据观测进行筛选和排序、抽样,以及数据的分组和汇总,如何对数据进行转置,使用函数等,
  第6章介绍了如何在整体上对数据集进行操作,包括如何对数据集进行横向连接和纵向连接,数据集之间的比较创建格式等。
  第7章讲解了数据的可视化及图表、报告的编制方法。
  第8章、第9章介绍了如何在SAS EG中运用提示、程序等来提高数据处理效率。
  各部分相互独立,读者可以根据自己的需要选择性阅读。
  本书特点
  1.关于SAS EG模块的首本中文教材;
  2.非单纯的逐个讲解菜单,而是将数据分析的基本思路、流程融入到软件的操作之中;
  3.每一章节通过设置商业背景,基本理论讲解的形式更贴近读者的实际工作;
  4.本书除讲解软件操作,还同时介绍了各种操作的SAS语言的实现过程,读者可以根据自己的基础逐步学习,进而走进SAS处理数据的大门。
  学习方法
  本书在编写上力求从读者的实战角度出发,每章基本上分为五部分:
  1.商业背景的介绍;
  2.相关的理论介绍;
  3.EG软件的解决方案;
  4.程序实现,包含实现菜单的程序的简单必要功能,读者可以轻松过渡到编程;
  5.扩展阅读,对于想深入学习SAS编程、数据准备的读者,进一步介绍了相关的学习内容及方向。
  读者可以根据自己的需要来阅读,本书的菜单操作部分以SAS Eenterprise guide 5.1为例进行示范,代码部分以SAS 9.3为基础进行编写,读者在理解基本思路之后可以方便将其应用到其它版本之上。
  售后服务
  为方便读者学习,本书提供了书中实例的源文件下载,请读者进入人大经济论坛(http://bbs.pinggu.org/),注册后搜索“CDA教材源文件”关键词下载相应的源文件。
  本书读者可以在人大经济论坛的“数据挖掘与商业智能(http://bbs.pinggu.org/forum-133-1.html)”就书中的问题进行提问,也欢迎大家就自己遇到的业务问题和大家讨论。同时,也可以向作者发邮件,作者邮箱为xuxiaog_2003@163.com。
  致谢
  本书由人大经济论坛策划,徐筱刚负责编写和完成统稿。
  丛书从策划到出版,倾注了电子工业出版社计算机图书分社张慧敏、石倩、官杨、张童等多位编辑的心血,特在此表示衷心地感谢!
  为保证丛书的质量,使其更贴近读者,我们组织了人大经济论坛的多位版主和高级会员参与了本书的预读工作,他们是杨同梅、田佳、孙华枫、原瑜芬、叶阵雨、郑赟、李剑宇、江翊雪、陈鹏、刘莎莎、丁亚军。感谢各位预读员的辛勤、耐心与细致,使得本丛书能以更加完善的面目与各位读者见面,特别感谢覃智勇圆满地组织了本次预读工作和审校工作。
  尽管作者们

CDA数据分析师系列丛书 如虎添翼!数据处理的SAS EG实现 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:CDA数据分析师系列丛书 如虎添翼!数据处理的SAS EG实现