1.7 统计过程控制与正态分布
统计经验表明,一个随机变量,如果是众多的、互不相干的、不分主次的偶然因素作用的结果之和,它就服从或近似服从正态分布(见图1-9),例如,在电子行业中,正常生产条件下各种电子产品的质量指标(如电容量、元器件的寿命等)就服从正态分布,它广泛应用于电子领域,作为分析问题的依据和方法。1733年,法国数学家棣莫弗就用n!的近似公式得到了正态分布。后来德国数学家高斯在研究测量误差时从另一个角度推导出了它,并研究了它的性质,因此,人们也将正态分布称为高斯分布。
图1-9
观察正态分布的总体密度曲线(见图1-9)的形状,具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图像来表示或近似表示:
式中,实数μ、σ(σ >0)是参数,分别表示总体的平均数与标准差,ϕμ, σ(x)的图像为正态分布密度曲线,简称正态曲线(图1-9)。
一般地,如果对于任何实数a<b,随机变量X满足
则称X的分布为正态分布(见图1-10)。正态分布完全由参数μ和σ确定,因此正态分布常记为N(μ, σ2)。如果随机变量X服从正态分布,则记为X~N(μ, σ2)。
图1-10
参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值去佑计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计。
正态分布N(μ, σ2)是由均值μ和标准差σ唯一决定的分布,通过固定其中一个值,可以分析均值与标准差对于正态曲线的影响。
正态分布曲线的性质有:
● 曲线在x轴的上方,与x轴不相交;
● 曲线关于直线x=μ对称;
● 当x=μ时,曲线位于最高点。
当x<μ时,曲线上升(增函数);当x>μ时,曲线下降(减函数),并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。
μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,总体分布越分散;σ越小,曲线越“瘦高”,总体分布越集中。
当μ=0、σ=l时,正态分布称为标准正态分布,其相应的函数表达式是
其相应的曲线称为标准正态曲线。标准正态总体N(0,1)在正态总体的研究中占有重要地位,任何正态分布的概率问题均可转化成标准正态分布的概率问题。
通过三组正态分布曲线(见图1-11、图1-12、图1-13),可知正态分布曲线具有“两头低、中间高、左右对称”的基本特征。由于正态分布是由其平均数μ和标准差σ唯一决定的,因此从某种意义上说,正态分布就有很多,给深入研究带来一定的困难,许多正态分布中,重点研究N(0,1),其他的正态分布都可以通过
转化为N(0,1),把N(0,1)称为标准正态分布,其密度函数为
从而使正态分布的研究得以简化。结合正态分布曲线的图形特征,可归纳正态分布曲线的性质。
图1-11
图1-12
图1-13
例1:求标准正态总体在(-1,2)内取值的概率。
解:对于标准正态分布曲线,标准正态总体N(0,1),Φ (x0)是总体取值小于x0的概率,即Φ (x0)=P(x<x0),其中x0>0,图1-14中阴影部分的面积表示为概率P(x<x0),只要查询标准正态分布表即可解决。从图1-14中不难发现,当x0<0时,Φ (x0)=1-Φ (-x0);而当x0=0时,Φ (0)=0.5。
图1-14
标准正态总体正态分布N(0,1)在正态总体的研究中具有非常重要的地位,为此本书专门给出了标准正态分布表(见表1-7)。在这个表中,对应于x0的值Φ (x0)是指总体取值小于x0的概率,即Φ (x0)=P(x<x0),x0≥0。
表1-7
p=Φ (x2 )-Φ (x1 )
Φ (2)-Φ (-1)=Φ (2)-{1-Φ[-(-1)]}
=Φ (2)+Φ (1)-1=0.9772+0.8413-1=0.8151
利用标准正态分布表(表1-7),可以求出标准正态总体在任意区间(x1, x2)内取值的概率,即直线x=x1、x=x2与正态曲线、x轴所围成的曲边梯形的面积,即
P(x1<x<x2 )=Φ (x2 )-Φ (x1 )
非标准正态总体在某区间内取值的概率,可以通过转化成标准正态总体,然后查标准正态分布表即可。在这里应重点掌握如何进行转化,首先要掌握正态总体的均值和标准差,然后进行相应的转化。
在电子行业中,将发生概率不超过5%的事件,即事件在一次试验中几乎不可能发生,定义为小概率事件。这也是很多行业产品可靠性系统分析中,都是采用单一故障(Single Fault Condition, SFC)分析的原因,因为两个不关联故障同时发生的概率远小于5%,因此定义为小概率事件。对于产品隐患的设计分析基础是RPN=S×O×D(DFMEA里的风险隐患量化评价方法,S是危害度、O是发生概率、D是可探测度),既然O很小,RPN很小,属于不考虑分析范围。就好像在选购住宅楼房时,没有人会将楼房必须能耐得住飞机撞击作为楼房质量指标一样,飞机撞击住宅楼是小概率事件,因此不予考虑;而一辆普通家用轿车撞击而导致楼塌的风险则必须考虑了。
例2:利用标准正态分布表求标准正态总体在下面区间取值的概率。
(1)在N(1,4)下,求F(3)。
(2)在N(μ, σ2)下,求F(μ -σ, μ +σ);
解:(1)。
(2)。
。
F(μ-σ, μ+σ)=F(μ+σ)-F(μ-σ)=0.8413-0.1587=0.6826。
正态总体N(μ, σ 2)取值的概率如图1-15所示。
图1-15
在区间(μ-σ, μ+σ)、(μ-2σ, μ+2σ)、(μ-3σ, μ+3σ)内取值的概率分别为68.3%、95.4%、99.7%,因此我们通常只在区间(μ-3σ, μ+3σ)内研究正态总体的分布情况,而忽略其他很小的一部分。但如果确定的质量目标是按照4σ、5σ、6σ所确定的,则相关要求就会更高。