欢迎光临
免费的PDF电子书下载网站

数据分析 PDF下载

编辑推荐

暂无

内容简介

本书着重介绍各种数据分析技术背后的原理,有利于实践者将技术具体应用到各种领域,或者在此基础上发展新的技术。全书共分三部分。*部分介绍统计学基本概念,包括蒙特卡罗方法和马尔科夫链。第二部分介绍统计学,并从频率派和贝叶斯派两种角度对比分析了各种数据建模的工具。第三部分重点介绍各种数据分析方法,比如关联函数、周期图、图像重建等。附录提供了相关的数学知识,以备读者查阅。本书可作为物理、工程相关专业研究生关于数据分析技术的标准教材,也可供科学家和工程师参考阅读。

作者简介

暂无

数据分析 PDF下载

目录

译者序
前言
第1章概率
11概率定律
12概率分布
121离散和连续概率分布
122累积概率分布函数
123变量变化
13概率分布的特征
131中位数、众数和半峰全宽
132矩、均值和方差
133矩母函数和特征函数
14多变量概率分布
141两个独立变量的分布

前沿

若推理不够,经验可以胜任。
数学是通向科学的大门和钥匙。
——罗杰·培根(约1214—1294年)

现代化计算机的发展深刻地改变了统计学的面貌。现在分析数据常规使用的技术在几年前都是不切实际,甚至是不可想象的。普通的笔记本电脑就能够轻松处理大数据并进行详尽的计算。曾经被认为深奥的技术现在已经成为常规工具:主成分分析、马尔可夫链蒙特卡罗抽样、非线性模型拟合、贝叶斯统计、LombScargle周期图等。科学家和工程师比以往任何时候都需要熟练掌握更多、更尖端的方法来分析数据。
多年来,我为天文系、物理系,偶尔也为工程系的研究生讲授数据分析的课程。课程的目的是培养实验者解释数据的必要能力,并为理论家提供足够的知识来理解(甚至有时是质疑)这些解释。我无法找到一本具体的书,或者一些相关的书籍,可以作为该课程的教材。课程中的大部分材料都不是初级的,而且通常不包括在许多关于数据分析的介绍性书籍范围内。而涵盖这些材料的书籍一般都高度专业,写作风格和语言对于大多数学生来说也都晦涩难懂。用特定计算机语言所写的书籍,大多涵盖特定算法,更合适作为补充资料。
鉴于教学需要,我为自己的课程编写了讲义,并将这些讲义整理成书。本书是一本关于数据分析的有一定深度的书,而不是统计学入门书籍。 诚然,人们可能会质疑是否需要对线性回归进行额外的基础性介绍。 但同时,本书涵盖了必要的基本概念和工具,内容自成体系,使各种背景的读者都易于理解。 虽然书中包括很多具体的例子,但它不是一本统计方法的“食谱”,也并不包含计算机代码。 相反,这门课程和这本书强调的是各种技术背后的原理,使从业者能够将技术应用于自己的问题,并能在必要时开发新的技术。本书的目标读者是研究生,也适用于高年级的本科生和在职的专业人士。
本书重点关注物理科学和工程领域工作人员的需求,因而尽可能少地描述那些在其他研究领域常用而在物理学中很少发挥重要作用的统计工具。所以,本书对假设检验没有太多介绍,甚至忽略了ANOVA技术, 尽管这些工具会在生命科学领域得到广泛应用。相反,数据的模型拟合和数据序列的分析在物理科学中是常见的,贝叶斯统计也越来越受到关注。本书将更加全面地讨论这些主题。
即使如此,这些主题也必须经过严格的筛选来满足一本书的篇幅要求,而我选择的标准是实用性。本书覆盖了物理科学家和工程师经常使用的数据分析工具,主要分为三个部分。
第一部分用3章介绍了概率的相关知识:第1章涵盖概率方面的基本概念,第2章介绍了一些实用的概率分布,最后第3章讨论了随机数和蒙特卡罗方法,包括马尔可夫链蒙特卡罗采样。
第二部分包括第4~7章,第4章介绍了统计学中的一些基本概念,第5章和第6章从频率论的角度(极大似然估计、线性和非线性的卡方最小化)介绍模型拟合,第7章从贝叶斯的角度介绍模型拟合。
最后一部分专门介绍数据序列。 先复习傅里叶分析(第8章),然后讨论功率谱和周期图(第9章),之后是卷积和图像重建,最后以自相关和互相关结束(第10章)。
本书重点强调了误差分析。这反映了我的一个坚定信念:数据分析不应该仅仅只是产生一个结果,而是还要评估这个结果的可靠性。这可能是一个数字加一个方差,也可能是置信区间,或者当处理似然函数或贝叶斯分析时,它可以是很多一维或者二维的边际分布图。
坚定的贝叶斯学派可能会对本书只花一章来介绍贝叶斯统计而感到不悦。事实上,虽然前两章是关于概率的,却提供了贝叶斯统计的必要基础;而第3章中对于马尔可夫链蒙特卡罗采样的漫长讨论,几乎完全是由贝叶斯统计所引导出来的。就像通常默认的,介绍最小二乘法估计的那两章里面很全面地讲述了似然函数。本书也可以作为一门只教授贝叶斯统计课程的教科书。因为书中讨论了数据分析的贝叶斯方法和频率论方法,可以直接比较两者。我发现这种比较可以大大提高学生对贝叶斯统计学的理解。
书中几乎所有的材料都已经公开发表或出版,但本书中的表述是我自己的。我的目标是以一种让我的学生和同事都容易理解的方式来撰写本书。本书的主要作用是将数学家的优雅且精确的语言翻译成数据科学家和工程师能够掌握的更宽松的工作语言。本书并不提及异方差数据,但会讨论变量数据,还会涉及相关的测量错误!
本书尽管在表述上是数学的,但写作风格是物理科学的。我的目的是让叙述清晰和准确,而不是严格,因此读者在书中找不到证明或引理。本书假设读者已经很熟悉多变量微积分,并且熟悉复数。书中也大量使用了线性代数。经验告诉我,大部分研究生至少上过一门线性代数课程,但他们很少使用线性代数知识,特别是涉及特征值和特征向量时。因此附录E提供了线性代数的详细回顾。一些会打乱本书主线的专题也被归入附录。由于序列分析的重要性,我们用一整章专门介绍了傅里叶分析。
最后,如果你打算阅读或教授本书,一个亘古不变的事实就是:“对于很多事情我们要先学习,才能去做,就像建筑工人在建造房子的过程中学习建筑技巧和七弦琴演奏者通过弹奏学习一样,我们要从实践中去学习”。为了学习如何分析数据,我们着手去分析数据——

数据分析 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:数据分析