编辑推荐
暂无
内容简介
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
作者简介
王学钦,博士,中山大学数学学院和中山医学院教授, 中山大学统计学科带头人,数学学院院长助理,中山大学华 南统计科学研究中心执行主任等。
赵鹏,2008年12月毕业于兰州大学获得理学博士学 位。江苏师范大学数学与统计学院教授、教务处处长,全国 工业统计教学研究会副秘书长、常务理事、青年统计学家协 会副会长,中国现场统计研究会大数据统计分会副理事长。
目录
前言(1)
 ;
1概率与计数(1)
11随机事件及其运算(1)
111随机现象与随机试验(1)
112样本空间与随机事件(2)
113事件间的关系及运算(3)
12概率空间(7)
121概率空间(7)
122概率的常用性质(9)
123概率的连续性(13)
13计数方法(15)
131两个计数原理(16)
132排列与组合(16)
133二项式系数与多项式系数(18)
134例题(20)
14概率的确定方法(25)
141频率方法(26)
142古典概型(27)
143几何概型(33)
144主观概率(36)
习题(37)
2条件概率(41)21条件概率与乘法公式(42)
211条件概率的定义(42)
212条件概率的性质(44)
213乘法公式(46)
22事件的独立性(48)
221两个事件的独立性(48)
222多个事件的独立性(51)
223事件的条件独立性(56)
23全概率公式与贝叶斯公式(58)
231全概率公式(58)
232贝叶斯公式(61)
233全概率公式与贝叶斯公式的条件形式(64)
习题(68)
3随机变量(71)31随机变量及其分布函数(71)
311随机变量(71)
312分布函数(73)
32随机变量的分类(75)
321离散型随机变量及其分布律(75)
322连续型随机变量及其概率密度(76)
323非离散非连续型随机变量及其分布(79)
33二维随机向量(81)
331联合分布与边缘分布(81)
332二维离散型随机向量(83)
333二维连续型随机向量(86)
34随机变量的独立性(89)
35随机变量函数的分布(93)
351离散型随机变量函数的分布(93)
352连续型随机变量函数的分布(95)
习题(103)
4常用的概率分布(109)41常用的离散型随机变量(109)
4110-1分布(两点分布)(109)
412二项分布(109)
413泊松(Poisson)分布(111)
414几何分布(113)
415超几何分布(114)
42常用的连续型随机变量(115)
421均匀分布(115)
422指数分布(116)
423正态分布(117)
424二维均匀分布(121)
425二维正态分布(123)
43随机数的产生(124)
习题(127)
5随机变量的数字特征(129)51数学期望(129)
52方差和协方差(135)
53矩和矩母函数(141)
54条件期望(147)
习题(153)
6不等式和极限定理(155)61概率不等式(155)
62大数定律(157)
63大数定律的应用(159)
631抛硬币试验(159)
632直方图近似概率密度函数(159)
633蒙特卡洛积分(160)
64中心极限定理(160)
习题(165)
参考文献(167)习题答案(168)
前沿
数据科学是基于数据“理解和分析实际现象”,是一个跨学科的领域。它从有用的视角开始,对结构化或非结构化数据进行收集、整理和分析。它以统计学、数学、计算机为三大支撑性学科,以生物、医学、环境科学、经济学、社会学、管理学为应用拓展性的学科。它是对数据进行处理的技术和流程的组合,以获得有价值的视角。通过使用科学的方法、算法、流程和系统来有效地提取信息,这些信息可以被用来做出关键的决策。
概率论是数据科学的基础之一,是对自然界及人类社会中的随机性和不确定性进行研究的科学,是研究随机现象的数量规律的一种有效方法。本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。
本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。其中第1、2章由古楠楠编写,第3、4章由张赛茵编写,最后两章由张娟编写,由王学钦、赵鹏担任主编。除了作者编写的内容外,部分例题和习题参考了本书后所列的参考书,在此对这些书的作者和译者表示感谢。
本书可作为统计学、大数据、数据科学等专业本科生的基础教材,也可作为从事数据统计分析研究人员、工程技术人员的工具书或参考读物。希望通过对本教材的学习,使读者能够掌握数据科学中所使用的概率的基本概念、基本方法和基本理论,具有利用这些理论和方法分析和解决实际问题的能力,并为一些后续数据科学相关课程的学习打下坚实的基础。
作者们长期从事概率论与数理统计、数据挖掘、统计计算、复杂数据分析等方向的教学和科研工作,但由于水平有限,书中难免有不妥及疏漏之处,敬请读者和同行不吝赐教。
数据科学的概率基础 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版