1.5 数理统计基础_土壤监测分析技术-QQ阅读男生都市网

上QQ阅读APP看书，第一时间看更新

1.5　数理统计基础

1.5.1　有关名词解释

（1）总体和个体

①总体　又称母体，是指研究对象的全体或某项测定对象的全体。如测定某样品的全体测定值，就是一个总体。

②个体　全体中的一个单位，称个体。测定某样品的全体测定中的每个测定，就是一个个体。

（2）样本和样本容量

①样本　总体的一部分称为样本。是指从总体中随机抽取出有限个个体的集合。

②样本容量　是样本所含个体的数目。

（3）统计量

样本的函数称为统计量。如常用的样本、方差S 2、标准偏差、相对标准偏差、极差等。

1.5.2　正态分布

在分析测试中，测量值和测定误差都是随机变量，它遵从一定的概率分布。若有n个测定值x1，x2，…，xn，当n足够大时，这几个测定值通常表现为正态分布，其分布曲线可以用正态概率密度函数来表示。

（1-16）

或表示为：

（1-17）

式中，x为该分布中随机抽取的样本值；μ为正态分布的总体均值，即期望值；σ为正态分布的总体标准偏差。

测量中随机误差的分布与测量值的分布一样，也遵从正态分布函数。

正态分布可以用两个参数来描述，就是算术平均值和标准偏差σ，平均值定出了分布的中心，标准偏差表示了数据的分布情况，所以若知道了某一正态分布的均值和标准偏差σ，这一正态分布就可以完全确定。正态分布曲线见图1-1。

图1-1　正态分布曲线

经计算得到：在正态分布中，样本分布，68.26%在±1σ的范围内，95.44%在±2σ的范围内，99.73%在±3σ的范围内。

1.5.3　t分布

在分析测试中，通常测量次数n比较少，可能只有3～5次，属于小样本的测试，t分布就是小样本测试数值和随机误差的分布规律。它是与正态分布相似的一种统计分布。t是一个统计量，定义为：

（1-18）

（1-19）

式中，为一样本平均值；μ为一样本真值；是一样本均值的标准偏差；Sx是单次测量值的标准偏差。

t分布的概率密度函数f（t）曲线见图1-2。t分布可以用t和f（自由度）来描述，t分布临界值见表1-27。

图1-2　t分布曲线

表1-27　t分布临界值表（双侧）

t分布曲线形状与正态分布相似，随着f增大，t分布曲线接近正态分布曲线，与f ∞时，二者是严格一致的。所以小样本的数据统计处理可以按正态分布一样的进行。由式（1-18）可以得到式（1-20），它表示了总体平均值的置信区间：

（1-20）

t值取决于约定显著水平α（置信度为1-α）和样本的容量n。tα·f临界值可由表1-27查得。

1.5.4　F分布

两个独立的随机样本分别来自两个独立的总体，如第一个样本（x1，x2，…，xn）为总体N（μ1，）的一个随机样本，而第二个样本（x1，x2，…，xn）为总体N（μ2，）的一个随机样本。它们的方差分别和，则统计量F为

　　（1-21）

f（F）分析概率密度数曲线是不对称的，它取决于F值和在计算两个样本方差和时的自由度f1和f2。

利用F分布可以检验两个或两个以上均数差别的显著性方法。F检验即是方差检验，两个均数间差异可以用t检验，也可以用F检验，但检验两个以上均数差别是否具有显著性时只能用F检验。利用F分布表查出相应的概率，用F0.05（f1，f2）和F0.01（f1，f2）值为显著性界限。F分布见表1-28。

表1-28A　F分布表（α=0.01）

表1-28B　F分布表（α=0.05）