土壤监测分析技术
上QQ阅读APP看书,第一时间看更新

1.5 数理统计基础

1.5.1 有关名词解释

(1)总体和个体

①总体 又称母体,是指研究对象的全体或某项测定对象的全体。如测定某样品的全体测定值,就是一个总体。

②个体 全体中的一个单位,称个体。测定某样品的全体测定中的每个测定,就是一个个体。

(2)样本和样本容量

①样本 总体的一部分称为样本。是指从总体中随机抽取出有限个个体的集合。

②样本容量 是样本所含个体的数目。

(3)统计量

样本的函数称为统计量。如常用的样本、方差S 2、标准偏差、相对标准偏差、极差等。

1.5.2 正态分布

在分析测试中,测量值和测定误差都是随机变量,它遵从一定的概率分布。若有n个测定值x1x2,…,xn,当n足够大时,这几个测定值通常表现为正态分布,其分布曲线可以用正态概率密度函数来表示。

(1-16)

或表示为:

(1-17)

式中,x为该分布中随机抽取的样本值;μ为正态分布的总体均值,即期望值;σ为正态分布的总体标准偏差。

测量中随机误差的分布与测量值的分布一样,也遵从正态分布函数。

正态分布可以用两个参数来描述,就是算术平均值和标准偏差σ,平均值定出了分布的中心,标准偏差表示了数据的分布情况,所以若知道了某一正态分布的均值和标准偏差σ,这一正态分布就可以完全确定。正态分布曲线见图1-1。

图1-1 正态分布曲线

经计算得到:在正态分布中,样本分布,68.26%在±1σ的范围内,95.44%在±2σ的范围内,99.73%在±3σ的范围内。

1.5.3 t分布

在分析测试中,通常测量次数n比较少,可能只有3~5次,属于小样本的测试,t分布就是小样本测试数值和随机误差的分布规律。它是与正态分布相似的一种统计分布。t是一个统计量,定义为:

(1-18)

(1-19)

式中,为一样本平均值;μ为一样本真值;是一样本均值的标准偏差;Sx是单次测量值的标准偏差。

t分布的概率密度函数ft)曲线见图1-2。t分布可以用tf(自由度)来描述,t分布临界值见表1-27。

图1-2 t分布曲线

表1-27 t分布临界值表(双侧)

t分布曲线形状与正态分布相似,随着f增大,t分布曲线接近正态分布曲线,与f ∞时,二者是严格一致的。所以小样本的数据统计处理可以按正态分布一样的进行。由式(1-18)可以得到式(1-20),它表示了总体平均值的置信区间:

(1-20)

t值取决于约定显著水平α(置信度为1-α)和样本的容量ntα·f临界值可由表1-27查得。

1.5.4 F分布

两个独立的随机样本分别来自两个独立的总体,如第一个样本(x1x2,…,xn)为总体Nμ1)的一个随机样本,而第二个样本(x1x2,…,xn)为总体Nμ2)的一个随机样本。它们的方差分别,则统计量F

  (1-21)

fF)分析概率密度数曲线是不对称的,它取决于F值和在计算两个样本方差时的自由度f1f2

利用F分布可以检验两个或两个以上均数差别的显著性方法。F检验即是方差检验,两个均数间差异可以用t检验,也可以用F检验,但检验两个以上均数差别是否具有显著性时只能用F检验。利用F分布表查出相应的概率,用F0.05f1f2)和F0.01f1f2)值为显著性界限。F分布见表1-28。

表1-28A F分布表(α=0.01)

表1-28B F分布表(α=0.05)