概率论与数理统计
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第三节 连续型随机变量及其分布

一、连续型随机变量

[定义1] 若对于随机变量X的分布函数Fx),存在非负可积函数fx),使得对于任意实数x,有

   (2-3-1)   

则称X为连续型随机变量,称fx)为X的概率密度函数,简称为概率密度或密度函数,记为Xfx).概率密度函数的图形称为X的密度曲线.

根据定义可知概率密度具有以下性质:

fx)≥0;

.

反之,若一个函数满足上述性质,则该函数可以作为某个连续型随机变量的概率密度函数.

连续型随机变量分布函数有以下性质.

①对于一个连续型随机变量X,若已知它的概率密度fx),根据定义可以求得分布函数Fx),同时可以通过密度函数的积分来求X落在任何区间上的概率,即

   (2-3-2)   

②连续型随机变量X取任一指定值aaR)的概率为0,因为

因此,对连续型随机变量X,有

P{a<Xb}=P{aX<b}=P{a<X<b}=P{aXb}

由此性质可见,连续型随机变量X取任意值a的概率为0,这说明概率为零的事件不一定是不可能事件.同样,概率为1的事件也不一定是必然事件.

③若fx)在x处连续,则有

F'x)=fx)  (2-3-3)

【例2-3-1】 设随机变量X的概率密度为

(1)求系数c

(2)求X的分布函数;

(3)求P{2<X≤3.5}.

解:(1)根据概率密度的性质有

解得,因此,密度函数为

(2)当x<0时,

当0≤x<3时,

当3≤x≤4时,

x>4时,

因此

(3).

【例2-3-2】 设随机变量X的分布函数为

(1)求概率P{0.3<X<0.7};

(2)X的概率密度.

解:(1)P{0.3<X<0.7}=F(0.7)-F(0.3)=0.4;

(2)X的概率密度为

二、几种常用的连续分布

1.均匀分布

[定义2] 若连续型随机变量X的概率密度为

X服从区间[ab]上的均匀分布,记作XUab].

由定义可知:(1)fx)≥0;(2).

均匀分布的分布函数为

对于任意的x1x2∈[ab](x1<x2),有

这表明均匀分布的随机变量X落入[ab]任意子区间的概率与该子区间的长度成正比,而与子区间的位置无关.

【例2-3-3】 某城市每天有两班开往某旅游景点的列车,发车时间分别为早上7点30分和8点,设一游客到达车站的时刻均匀分布于早上7~8点之间,求此游客候车时间不超过20分钟的概率.

解:设游客到达车站的时间为7点过X分,则XU[0,60],因此X的概率密度为

游客只有在7:10~7:30之间或7:40~8:00之间到达车站,候车时间不超过20分钟,因此所求概率为

2.指数分布

[定义3] 若连续型随机变量X的概率密度为

其中λ>0为常数,则称X服从参数为λ的指数分布,记作Xeλ).

指数分布的分布函数为

指数分布常用来描述各种“寿命”,如电子元器件的寿命、动物寿命、随机服务系统中的等候时间都服从指数分布.指数分布在可靠性理论和排队轮中有广泛的应用.

【例2-3-4】 设某电子元器件的寿命X(单位:小时)服从参数为的指数分布.

(1)求该元器件在使用800小时后仍没有坏的概率;

(2)求在该元件已经使用了600小时未坏的条件下,它还可以再使用800小时的概率.

解:(1)元器件的寿命X的分布函数为

因此

(2)

上例(2)中的计算结果表明:P{X>1400│X>600}=P{X>800},即在元件使用了600小时未坏的条件下,可以再继续使用800小时的概率,等于它从启用起使用800小时不坏的无条件概率,这种性质称为指数分布的“无记忆性”,相当于说,元器件对已使用过的600小时没有记忆,不影响它以后使用寿命的统计规律.

3.正态分布

[定义4] 若连续型随机变量X的概率密度为

其中μσ均为常数,且σ>0,则称X服从参数为μσ2的正态分布,记作XNμσ2).

正态分布的概率密度具有以下性质:

①概率密度的图形关于直线x=μ对称,当x=μ时,fx)达到最大值:

②概率密度曲线在x=μ±σ处对应有拐点;

③概率密度曲线以x轴为水平渐近线.

正态分布的密度曲线也称作正态曲线,它是一条钟形曲线:中间高、两边低、左右对称.从图2-3-1、图2-3-2中可以看出,参数μ确定了正态曲线的位置,而σ的大小决定了曲线的陡峭程度.

图2-3-1

图2-3-2

正态分布是概率论与数理统计中最重要的分布,很多随机现象可以用正态分布描述或近似描述,例如:

①测量时产生的误差ε是随机变量,时大时小,时正时负,但是误差大的可能性小,误差小的可能性大,正负误差出现的机会相同,这个特点与正态曲线“中间高、两边低、左右对称”是吻合的,因此测量误差服从正态分布;

②自动包装流水线上生产的罐头重量服从正态分布;

③同年龄人的身高与体重分别都服从正态分布;

④某个地区的年降雨量(单位:毫米)服从正态分布;

⑤超市在一周内售出的鸡蛋的总重量服从正态分布.

正态分布的分布函数为

在正态分布中,当参数μ=0、σ=1时称为标准正态分布,记作XN(0,1),此时密度函数

分布函数

此时正态曲线见图2-3-3.

图2-3-3 正态曲线

x≥0时,标准正态分布的分布函数值Φx)由标准正态分布表(附表2)可查,由此来计算正态分布的概率,根据标准正态曲线的对称性,可知,当x<0时

Φx)=1-Φ(-x)  (2-3-4)

XN(0,1),则

P{Xx}=Φx

P{X>x}=1-Φx

P{x1<Xx2}=Φx2)-Φx1

P{|X|≤x}=2Φx)-1,(x≥0)

【例2-3-5】 XN(0,1),求P{X≤-1.25}及P{-1.5<X<2.3}.

解:由附表2可查得Φ(1.25)=0.8944,于是

P{X≤-1.25}=Φ(-1.25)=1-Φ(1.25)=1-0.8944=0.1056

  P{-1.5<X<2.3}=Φ(2.3)-Φ(-1.5)=Φ(2.3)-[1-Φ(1.5)]

         =0.9893+0.9332-1=0.9225

任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.

定理 设XNμσ2),则.

证明 的分布函数

,上式等于

P{Yx}=Φx

因此   

XNμσ2),则X的分布函数

   (2-3-5)   

XNμσ2),则

(1)

(2)

(3)

【例2-3-6】 XN(8,0.52),求P{|X-8|≤1}及P{X<10}.

  解:  

【例2-3-7】 XNμσ2),求:

(1)P{μ-σ<X<μ+σ},

(2)P{μ-2σ<X<μ+2σ}

(3)P{μ-3σ<X<μ+3σ}

解:(1)

(2)

(3)

由此看出:X的取值大部分落在区间(μ-σμ+σ)内,基本上落在区间(μ-2σμ+2σ)内,几乎全部落在区间(μ-3σμ+3σ)内,落在以μ为中心、3σ为半径的区间外的概率不到0.003.

从理论上讲,服从正态分布的随机变量X的取值范围是(-∞,+∞),但实际上X取区间(μ-3σμ+3σ)外的数值的可能性微乎其微.因此,往往认为它的取值是个有限区间,即区间(μ-3σμ+3σ),即实用中的三倍标准差规则,也叫3σ规则.在企业管理中,经常应用这个规则进行质量检查和工艺过程控制.

【例2-3-8】 某厂生产罐装咖啡,每罐标准重量为1千克,长期生产实践表明自动包装机包装的每罐咖啡的重量X服从参数σ=0.1千克的正态分布.为了使重量少于1千克的罐头数不超过10%,应把自动包装线控制的平均值μ调节到什么位置上?

解:XNμ,0.12),若把自动包装线控制的在μ值调节到1千克位置,则有:

即重量少于1千克的罐头占全部罐头数的50%,这显然不符合要求.所以应该把自动包装线控制的μ值调节到比1千克大一些的位置,使得

查附表2可得Φ(1.29)=0.90147>0.9,得μ=1+0.1×1.29=1.129.

即将包装控制的平均值μ调节到1.129处,可使得少于1千克的罐头数不超过10%(见图2-3-4、图2-3-5).

图2-3-4

图2-3-5