1.5 数理统计基础
1.5.1 有关名词解释
(1)总体和个体
①总体 又称母体,是指研究对象的全体或某项测定对象的全体。如测定某样品的全体测定值,就是一个总体。
②个体 全体中的一个单位,称个体。测定某样品的全体测定中的每个测定,就是一个个体。
(2)样本和样本容量
①样本 总体的一部分称为样本。是指从总体中随机抽取出有限个个体的集合。
②样本容量 是样本所含个体的数目。
(3)统计量
样本的函数称为统计量。如常用的样本、方差S 2、标准偏差、相对标准偏差、极差等。
1.5.2 正态分布
在分析测试中,测量值和测定误差都是随机变量,它遵从一定的概率分布。若有n个测定值x1,x2,…,xn,当n足够大时,这几个测定值通常表现为正态分布,其分布曲线可以用正态概率密度函数来表示。
(1-16)
或表示为:
(1-17)
式中,x为该分布中随机抽取的样本值;μ为正态分布的总体均值,即期望值;σ为正态分布的总体标准偏差。
测量中随机误差的分布与测量值的分布一样,也遵从正态分布函数。
正态分布可以用两个参数来描述,就是算术平均值和标准偏差σ,平均值定出了分布的中心,标准偏差表示了数据的分布情况,所以若知道了某一正态分布的均值和标准偏差σ,这一正态分布就可以完全确定。正态分布曲线见图1-1。
图1-1 正态分布曲线
经计算得到:在正态分布中,样本分布,68.26%在±1σ的范围内,95.44%在±2σ的范围内,99.73%在±3σ的范围内。
1.5.3 t分布
在分析测试中,通常测量次数n比较少,可能只有3~5次,属于小样本的测试,t分布就是小样本测试数值和随机误差的分布规律。它是与正态分布相似的一种统计分布。t是一个统计量,定义为:
(1-18)
(1-19)
式中,为一样本平均值;μ为一样本真值;是一样本均值的标准偏差;Sx是单次测量值的标准偏差。
t分布的概率密度函数f(t)曲线见图1-2。t分布可以用t和f(自由度)来描述,t分布临界值见表1-27。
图1-2 t分布曲线
表1-27 t分布临界值表(双侧)
t分布曲线形状与正态分布相似,随着f增大,t分布曲线接近正态分布曲线,与f ∞时,二者是严格一致的。所以小样本的数据统计处理可以按正态分布一样的进行。由式(1-18)可以得到式(1-20),它表示了总体平均值的置信区间:
(1-20)
t值取决于约定显著水平α(置信度为1-α)和样本的容量n。tα·f临界值可由表1-27查得。
1.5.4 F分布
两个独立的随机样本分别来自两个独立的总体,如第一个样本(x1,x2,…,xn)为总体N(μ1,)的一个随机样本,而第二个样本(x1,x2,…,xn)为总体N(μ2,)的一个随机样本。它们的方差分别和,则统计量F为
(1-21)
f(F)分析概率密度数曲线是不对称的,它取决于F值和在计算两个样本方差和时的自由度f1和f2。
利用F分布可以检验两个或两个以上均数差别的显著性方法。F检验即是方差检验,两个均数间差异可以用t检验,也可以用F检验,但检验两个以上均数差别是否具有显著性时只能用F检验。利用F分布表查出相应的概率,用F0.05(f1,f2)和F0.01(f1,f2)值为显著性界限。F分布见表1-28。
表1-28A F分布表(α=0.01)
表1-28B F分布表(α=0.05)