实验3-1 单样本T检验
素材文件:sample/Chap03/shuiyang.sav
多媒体教学文件:视频/实验3-1.mp4
实验基本原理
单样本T检验过程(One-Sample T Test)相当于数理统计中的单个总体均值的假设检验,根据样本观测值,检验抽样总体的均值与指定的常数之间的差异程度,即检验零假设H0:μ=μ0。设n为样本容量,为样本均值,检验使用T统计量,在原假设成立的条件下,T统计量表达式为:
其中,为标准差。我们检验的目的是推断样本所代表的未知总体的均值与已知总体的均值有无差异。
实验目的与要求
实验目的:通过实验掌握单样本T检验的方法和思想,要能够应用这种方法对一组观测数据的均值与总体均值的真值没有显著性差异的假设进行统计检验。
实验要求:了解单样本T检验统计量的计算方法和服从的分布性质,能够用SPSS中的单样本T检验过程对样本数据进行检验,会解释此过程的输出结果中各个统计量的统计含义和实际意义。
实验内容及数据来源
本次实验使用的数据是用某种新测量方法测得的某水域水样中CaCO3含量的观测值,数据共有11个观测样本,分别代表了11次的重复测定,每一个观测值表示的是水样中CaCO3含量的观测值。图3-1给出了这些数据。这些数据见本书附赠资源Chap03文件夹下的shuiyang.sav。假设我们已知这个水域中CaCO3含量的真值为20.7mg/L,实验的内容则是检验前面这种新测量方法测得的数据的均值是否偏高,从而评价这种新方法的准确性。
图3-1 shuiyang.sav数据集中的数据
实验操作指导
实验的操作步骤如下:
01 选择“文件︱打开︱数据”命令,打开shuiyang.sav数据表。
02 选择“分析︱比较平均值︱单样本T检验”命令,弹出“单样本T检验”对话框,在左侧变量框中选择“CaCO3(mg/L)”变量,单击按钮将其选入右侧的“检验变量”列表框中,如图3-2所示。注意“检验变量”列表框下面的“检验值”,在该文本框中输入20.7,这是已知总体均值的真值,我们要做的是将样本观测的样本均值与这个总体均值的差做单样本T检验。
03 单击“选项”按钮,打开“单样本T检验:选项”对话框,如图3-3所示。
图3-2 “单样本T检验”对话框
图3-3 “单样本T检验:选项”对话框
对话框选项设置/说明
“置信区间百分比”显示平均数与假设检验值之差的置信区间,默认值为95%,读者可以输入1~99之间的数值作为置信度。
“缺失值”选项组中有两个选项,表示两种缺失值的处理方法。
● 按具体分析排除个案:表示对于每个检验均只使用有效样本,因此检验的样本个数可能不同。
● 成列排除个案:表示只有当所有的检验变量均为有效值的样本才会被分析,所有检验的样本数相等。
由于我们的数据中不含缺失值,因此选择哪一个选项对于本次实验来说结果都是一样的。
04 单击“继续”按钮返回“单样本T检验”对话框,单击“确定”按钮,进入计算分析。
计算机运行完成后得到结果,如图3-4和图3-5所示。
实验结论
图3-4给出了样本的几个简单的描述性统计量,包括样本数(N)、平均值、标准偏差及标准误差平均值,从这里我们看到这些观测值的均值为21.0373,稍稍大于总体均值的真值20.7。
图3-5给出了检验结果,T统计量的值为1.064,双侧显著性水平的P值(Sig.(双尾))为0.312,大于0.05,也就是说在0.05的显著性水平下我们不能认为该法测得的均值偏高,这个结果也同样可以从差分的95%置信区间中看到,我们的样本观测值的均值21.0373与真值20.7之差落在区间-0.3692~1.0438之间,所以可以认为这种新的测量方法测得的样本均值没有偏高。
图3-4 单样本统计
图3-5 单样本T检验结果