实验2-2 描述统计量
素材文件:sample/Chap02/desc.sav
多媒体教学文件:视频/实验2-2.mp4
实验基本原理
描述性统计分析要对调查总体所有变量的数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布及一些基本的统计图形。读者不难发现这个过程与上次实验中讲的频数分析过程有些重复的地方。但是,在SPSS 25.0中,当我们仅需了解统计量的数值时,使用描述统计命令计算更加简便、快捷。
实验目的与要求
实验目的:通过本次实验掌握SPSS中描述性统计的操作步骤,能够解释输出结果表中的各个描述性统计量的统计学含义及所代表的实际含义,能通过这个过程了解数据的基本特征和结构,从而为更复杂的统计分析做好准备。
实验要求:在SPSS中完成描述性统计的全部过程,认真思考描述性统计的必要性和重要性,熟悉各个统计量的计算方法和步骤,通过输出的结果来描述数据的基本特征。
实验内容及数据来源
本次实验使用的数据是一组医学数据,它记录了某地区130名正常男子血液中的红细胞数(RBC,万/mm),图2-8给出了部分数据。本实验的内容是对这130名正常男子血液中的红细胞数进行描述性统计分析。
图2-8 数据集desc.sav的部分数据
实验操作指导
实验的操作步骤如下:
01 选择“文件︱文件︱数据”命令,打开desc.sav数据表。
02 选择“分析︱描述统计︱描述”命令,弹出“描述”对话框,在左侧变量框中选择“红细胞数(RBC)”,单击按钮将其选入右侧的“变量”列表框中,同时在下方选中“将标准化值另存为变量”复选框,如图2-9所示。
03 单击“选项”按钮,打开“描述:选项”对话框,如图2-10所示。同时选中“平均值”和“总和”复选框,将“离散”选项组中的“标准差”“最小值”“方差”“最大值”“范围”及“标准误差平均值”复选框全部选中,并选中“表示后验分布的特征”选项组中的“峰度”和“偏度”复选框。最下面的是“显示顺序”选项组,可以选择“变量列表”“字母”“按平均值的升序排序”或“按平均值的降序排序”,在这里我们选择“变量列表”,也可以选择其他显示方式。
图2-9 “描述”对话框
图2-10 “描述:选项”对话框
04 单击“继续”按钮回到“描述”对话框,单击“确定”按钮,进入计算分析。
计算机运行完成后得到分析结果,如图2-11所示。
图2-11 描述统计量
实验结论
从图2-11可以看出,130名正常成年男子血液中红细胞数观察样本数(N)为130、范围统计为209、最小值统计为379、最大值统计为588、合计统计为62316、均值统计为479.35、均值的标准错误(同标准误差)为3.640、标准偏差统计为41.506、方差统计为1722.773、偏度统计为0.011、偏度的标准错误(同标准误差)为0.212、峰度统计为-0.140、峰度的标准错误(同标准误差)为0.422。这些统计量都是描述性统计中最基本的统计量,在以后更复杂、更高级的统计分析中处处会用到这些基本知识,读者务必要熟悉它们的含义。关于数据分布偏度、峰度的概念在实验2-1中详细介绍过,这里不再赘述。本例中偏度统计为0.011,表明数据有很小程度的右偏;峰度统计为-0.140,表明数据分布曲线为平峰分布。另外,我们注意到在数据视图窗口出现了一列新的数据Zrbc,如图2-12所示。产生这一结果的原因是我们在前面操作中选中了“将标准化值另存为变量”复选框,SPSS将变量rbc的数据进行了Z标准化,并且将标准化后的数据另存为了Zrbc。
图2-12 新产生的Zrbc变量
Z标准化得分是某一数据与平均数的距离以标准差为单位的测量值。Z标准化的数据绝对值越大,说明它离平均数越远。标准化值不仅能表明各原始数据在一组数据分布中的相对位置,而且能在不同分布的各组原始数据间进行比较,同时还能接受代数方法的处理。因此,标准化值在统计分析中起着十分重要的作用。本例中,第一条数据的Z标准化得分为-2.41780,说明该正常成年男子血液中红细胞数要低于平均值,并且距离平均值的距离要远于第二条数据(Z标准化得分为-0.53857);第三条数据的Z标准化得分为0.95518,说明该正常成年男子血液中红细胞数要高于平均值,并且距离平均值的距离要远于第四条数据(Z标准化得分为0.16012)。