Python概率统计
上QQ阅读APP看书,第一时间看更新

第2章 随机变量及其分布

一个随机试验的结果全体构成一个基本空间S,可以把这个试验的所有可能的结果用实数表示。例如当抛硬币时,可能的结果是正面朝上和反面朝上。如果定义一个随机变量X,当正面朝上时,X取值为1,当反面朝上时,X取值为0。又例如抛一个骰子,它所有可能的结果是1点、2点、……、6点,如果定义一个随机变量X,当出现i点时取值为i。这样定义的随机变量是定义在Ω上取值为实数的函数。也就是说,基本空间S的每个点,都有实数轴上的点与其对应,由此可以利用现代数学工具来研究随机现象。

对于随机变量,主要关注它的以下4方面。

(1)分布律:随机变量在实数轴取不同值的可能性大小的刻画,是随机变量的分布规律。

(2)分布函数:单调递增的用于定义概率值的函数,是分布“规律”的另一种描述。

(3)分位数:分布函数的反函数,用于计算给定概率值的临界点,在统计学中经常使用。

(4)随机数:数值模拟中经常需要产生符合某种分布的随机数,主要用于随机模拟和计算。

分布函数(Cumulative Distribution Function, CDF)是概率统计中重要的函数,正是通过它,可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。

分位数(Quantile),也称分位点,是指将一个随机变量的概率分布范围分为几个数值点,常用的有中位数(二分位数)、四分位数、百分位数等。

随机数一般指伪随机数,它是用确定性的算法计算出来的随机数序列,并不真正随机,但具有类似于随机数的统计特征,如均匀性、独立性等。在计算伪随机数时,若使用的初值(种子)不变,则伪随机数的数序也不变。伪随机数可以用计算机大量生成,在模拟研究中为了提高模拟效率,一般采用伪随机数代替真正的随机数。模拟中使用的一般是循环周期极长并能通过随机数检验的伪随机数,以保证计算结果的随机性。

本章介绍概率论的基本概念,主要包括以下内容:

(1)随机变量及其分布函数。

(2)离散型随机变量及其分布律。

(3)连续型随机变量及其概率密度。

(4)随机变量函数的分布。