分析测试统计方法和质量控制
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.1 变差平方和的分解

在分析测试中,对一个样品进行重复测试,所得到的测量值不尽相同,它们之间的差异称为变差。如果一个测量值受多个因素的影响,则每个因素都要对测量的总变差做贡献。

数理统计中通常用变差平方和来表征测量结果变动性的大小,变差平方和是一组测量数据每个测量值xi与平均值之差的平方总和:

变差平方和简称平方和,是表示每个测量值xi偏离测量平均值的程度的一个总量度,它的数值愈大,表示测量值之间的差异愈大。变差平方和的特点是考虑了每一个测量值所提供的信息,变差平方和随测量值数目的增加而增大。如果不知道测量次数的多少,单纯以变差平方和还不能判断测量数据变动性的大小。为此,数理统计中更常用方差s2来表征变差的大小:

式中,ν为自由度。方差s2表征了变差大小的统计平均值。方差中采用了平方和的表示式,因此测量值中偏离平均值大的测量值对平方和的贡献就大,这在统计中有利于对异常因素和异常值的判断。

总的变差平方和等于各因素引起的变差平方和的总和。变差平方和的加和性是方差分析的基础。

在认识方差分析前,以实例说明变差平方和的加和性和方差分析的基本思想。

【例3-1】 某产品生产中一直使用甲厂提供的原料,现发现甲厂原料纯度变动较大,进行了不同批次原料对产品的收得率试验,试验结果如表3-1所示,试问不同批次原料对产品的收得率是否有显著影响。

表3-1 不同批次原料对产品收得率的影响  单位:%

显然,如果没有试验误差,那只要对各批次各做一次试验,就可比较其收得率大小。然而,试验结果总是受试验误差的影响。虽然每批次的平均值有明显的差别,但因不知道试验误差影响的大小,仍然不能判断其差别是试验误差引起的还是原料批次引起的。因此,为能做出一个合理的判断,我们首先要对试验误差影响的大小有个定量的估计,并计算原料批次影响的大小,然后加以比较,从统计上给出合理的评价。

所有试验收得率的总变差平方和用QT表示,它表示全部15次试验的收得率与收得率总平均值(76.573%)之差平方的总和:

试验误差影响的大小可以用每次收得率与其批平均收得率之差的平方和Qe表示,即

试验进行3批次,每批次收得率平均值分别为78.02%、76.56%和75.14%,则每批次平均值与总平均值之差的平方和表示批次对收得率的影响,由于每批次进行5次试验,因此其平方和还要乘以5,以QA表示原料批次对收得率影响的大小:

不难看出,有

计算表明,收得率的变动性可分解成原料批次引起的变动性和试验误差引起的变动性两个部分,即数据总的变差平方和等于因素A(批次)变动引起的变差平方和加上试验误差变差平方和。对多因素的试验,总的变差平方和等于各因素引起的变差平方和的总和。

从变差平方和的计算方法可知,变差平方和不仅与数据本身大小有关,还与数据数目有关。为消除数据数目对平方和的影响,在统计方法中采用平均平方和QAAQee进行比较,这里的νAνe分别是QAQe的自由度。

平方和中能够独立地变化的项数,称为这个平方和的自由度。上例中Qe涉及3组15个数据,其自由度νe=15-3=12;QA涉及3组数据,自由度νA=3-1=2;QT涉及15个数据,νT=15-1=14。由此,QT的自由度νT等于QA的自由度νA加上Qe的自由度νe。即总变差平方和的自由度等于各因素变差平方和自由度之和(νT=νA+νe),这就是自由度的加和性。

这样,就可以进行批次引起的变差因素与试验误差因素的比较了,计算统计量FA

显然,如果FA接近1,表明批次因素A的影响与试验误差的影响相近,无显著性差异;当FA大于1,表示因素A的影响比误差的影响大;而FA小于1,表示因素A的影响比误差的影响要小。一般来讲,影响大,并不表示在统计上是显著的。现在要问,FA多大时才认为因素A的影响是显著的。统计研究表明,FA是服从F分布的。由此,在进行统计分析时,由F分布表查出给定显著性水平α的临界值,当时,可认为相对于试验误差,因素A的影响不显著,而当时,则认为因素A的影响显著。

由此,

F分布表,F0.05(2,12)=3.89,F0.01(2,12)=6.93

方差分析表明,在0.05显著性水平下,原料批次对收得率有显著的影响,而在0.01显著性水平,认为其影响不显著。如果要得到更为可靠的结论,需增加原料批次的试验。表3-2列出了本例方差分析各统计参数。

表3-2 方差分析统计参数

注:通常,符号*表示显著,**表示高度显著。