3.3.2 探索分析的SPSS操作
打开相应的数据文件或者建立一个数据文件后,即可在SPSS Statistics数据编辑器窗口中进行探索分析,其过程如下:
(1)在SPSS Statistics数据编辑器窗口的菜单栏中选择“分析”|“描述统计”|“探索”命令,打开如图3-17所示的“探索”对话框。
(2)选择变量。从源变量列表框中选择需要分析的目标变量,然后单击按钮将选中的变量选入“因变量列表”列表框中;从源变量列表中选择分组变量,然后单击按钮选入“因子列表”列表框中;从源变量列表框中选择标注变量,单击按钮选入“个案标注依据”列表框中。
图3-17 “探索”对话框
因变量列表:该列表框中的变量为探索分析过程中需要分析的目标变量,变量的属性一般为连续型变量或比率变量。
因子列表:该列表框中的变量为“因变量列表”中目标变量的分组变量,就是对所需要分析的目标变量进行分组表示,该变量的属性可以是字符型或数值型,但是一般变异较少。
个案标注依据:一般对输出异常值时,用该变量进行标识,有且只有一个标识变量。
如将图3-17中的源变量分别选入“因变量列表”“因子列表”“个案标注依据”列表框中,如图3-18所示。
(3)进行相应的设置。
1.“统计”设置
单击右侧的“统计”按钮,弹出如图3-19所示的“探索:统计”对话框。该对话框用于设置需要在输出结果中出现的统计量,其中包含4个复选框,具体如下:
图3-18 选入各个变量
图3-19 “探索:统计”对话框
“描述”复选框:选中该复选框,表示输出一些描述性分析中的基本统计量,如均值、标准差、范围等,该复选框还包括一个“平均值的置信区间”文本框,要求设置均值的置信区间的范围,可以选择1%~99%中的任意一个,但系统默认的是95%的置信区间。
“M-估计量”复选框:选中该复选框,表示输出4种均值的稳健极大似然估计量,包括稳健估计量、非降稳健估计量、波估计值、复权重估计量,一般在样本数据非正态分布时,如金融时间序列数据的尖峰厚尾分布,用稳健极大似然估计量计算的均值更有稳健性。
“离群值”复选框:选中该复选框,表示输出变量数据的前5个最大值和后5个最小值。
“百分位数”复选框:选中该复选框,表示输出变量数据的百分位数。
2.“图”设置
单击右侧的“图”按钮,弹出如图3-20所示的“探索:图”对话框。该对话框中包含3个选项组和1个复选框:
图3-20 “探索:图”对话框
“箱图”选项组:该选项组用于对箱图的参数进行设置,包括3个单选按钮:“因子级别并置”表示多个因变量箱图将按照因变量的个数分别显示;“因变量并置”表示多个因变量箱图将不按照因变量的个数分别显示,而是一起显示在一个框图里面;“无”表示将不显示因变量的箱图。
“描述图”选项组:该选项组用于对统计图表进行设置,包括两个复选框:“茎叶图”表示将按照因变量输出相应的茎叶图;“直方图”表示将按照因变量输出相应的直方图。
“含莱文检验的分布-水平图”选项组:该选项组用于对数据转换的散布水平图进行设置,可以显示数据转换后的回归曲线斜率和进行方差齐性的莱文检验,包括4个单选按钮:“无”表示将不输出变量的散布水平图;“幂估算”表示对每一个变量数据产生一个中位数的自然对数和四分位数的自然对数的散点图,还可以对各个变量数据方差转化为同方差所需要幂的估计;“转换后”表示对因变量数据进行相应的转换,具体的转换方法有自然对数变换、1/平方根的变换、倒数变换、平方根变换、平方变换、立方变换;“未转换”表示不对原始数据进行任何变换。
“含检验的正态图”复选框:选中该复选框,可以输出变量数据的正态概率图和离散正态概率图,同时输出变量数据经过Lilliefors显著水平修正的柯尔莫戈洛夫-斯米诺夫统计量和夏皮洛-威尔克统计量。
3.“选项”设置
单击右侧的“选项”按钮,弹出如图3-21所示的“探索:选项”对话框。该对话框用于对缺失值进行设置,设置方法有3种:
图3-21 “探索:选项”对话框
“成列排除个案”表示只要任何一个变量含有缺失值,就要剔除所有因变量或分组变量中有缺失值的观测记录。
“成对排除个案”表示仅仅剔除所用到的变量的缺失值。
“报告值”表示将变量中含有的缺失值单独作为一个类别进行统计并输出。
设置完毕后,单击“继续”按钮,返回“探索”对话框。单击“确定”按钮,就可以在SPSS Statistics查看器窗口得到所选择的变量探索性分析的结果。