SPSS统计分析从入门到精通(第五版)
上QQ阅读APP看书,第一时间看更新

3.4.2 列联表分析的SPSS操作

打开相应的数据文件或建立一个数据文件后,可以在SPSS Statistics数据编辑器窗口中进行列联表分析。

(1)在SPSS Statistics数据编辑器窗口的菜单栏中选择“分析”|“描述统计”|“交叉表”命令,打开如图3-32所示的“交叉表”对话框。

(2)选择变量。在源变量列表框中选择行变量,然后单击按钮将选中的变量选入右侧“行”列表框中,将列变量选入右侧“列”列表框中;如果有分层变量,则将其选入右侧的“层1/1”列表框中。

图3-32 “交叉表”对话框

 “行”列表框:该列表框中的变量为交叉分析表的行变量,变量的属性一般为数值型变量或字符型变量。

 “列”列表框:该列表框中的变量为交叉分析表的列变量,变量的属性一般为数值型变量或字符型变量。

 “层1/1”列表框:该列表框中的变量为交叉表格分析中分层变量,该变量主要用于对频数分布表进行分层,对每一层都可以进行行和列的交叉表格分析。如果需要加入新的分层变量,单击“下一个”按钮;如果需要修改已经加入的分层变量,单击“上一个”按钮返回即可。

(3)进行相应的设置。

1.“精确检验”设置

单击“精确”按钮,弹出如图3-33所示的“精确检验”对话框。该对话框主要用于设置计算显著性水平的方法,有3种方法。

图3-33 “精确检验”对话框

①“仅渐进法”单选按钮:该方法适用于具有渐进分布的大样本数据,基于统计量的渐进分布计算相应的显著性水平(显著性),当输出的显著性水平低于临界值时,认为是显著的且可以拒绝原假设。

②“蒙特卡洛法”单选按钮:该方法不需要样本数据具有渐进分布的前提假设,为精确显著性水平的无偏估计,是非常有效的计算确切显著性水平的方法。在“置信度级别”文本框中输入置信水平来确定置信区间的范围(默认为99%),在“样本数”文本框中输入样本的抽样次数(默认为10000次)。

③“精确”单选按钮:该方法表示给定时间限制下计算统计量的显著水平(显著性),一般在给定时间限制的情况下,使用精确方法代替蒙特卡洛估计法。另外,对于非渐进方法,计算检验统计量时,总是将单元格计数四舍五入或舍位。系统默认的精确检验方法为“仅渐进法”。

2.“统计”设置

单击“统计”按钮,弹出如图3-34所示的“交叉表:统计”对话框。该对话框用于设置输出的统计量。各选项(统计量)(组)含义介绍如下:

①“卡方”复选框:选中该复选框,表示对行变量和列变量的独立性进行卡方检验。

②“相关性”复选框:主要对变量进行相关系数检验,包括斯皮尔曼相关系数检验和Person相关系数检验。Person相关系数检验是按区间检验,斯皮尔曼相关系数检验则是按照顺序检验。

图3-34 “交叉表:统计”对话框

③“Kappa”复选框:主要通过输出Cohen’s Kappa统计量来衡量对同一对象的两种评估是否具有一致性,取值范围为0~1,1表示完全一致,0表示完全不一致。该统计量仅仅适用于行变量和列变量取值个数和范围一致时的情况。

④“风险”复选框:用来衡量某事件(行变量)对某因素(列变量)的影响大小。建议仅对无空单元格的二维表计算。

⑤“麦克尼马尔”复选框:该复选框通过输出麦克尼马尔-Bowker统计量来对二值变量的非参数检验,利用卡方分布对响应变化进行检验,例如可以用来检验车祸前和车祸后,司机对安全意识的变化。该检验仅仅在行变量和列变量相等时才可以使用。

⑥“柯克兰和曼特尔-亨塞尔统计”复选框:该复选框是对一个二值因素变量和一个二值响应变量的独立性进行检验,在“检验一般比值比等于”文本框中输入一个正数(默认为1)。

⑦“名义”选项组:该选项组主要用于名义变量统计量的定制,包括4个复选框。

 列联系数:表示基于卡方检验的相关性的检验,取值在0~1,0表示完全不相关,1表示完全相关。

 Phi和克莱姆V:同样是两个表示相关性的检验统计量。

 Lambda:对有序变量相关性的度量,取值在-1~1,-1表示完全负相关,1表示完全正相关,0表示完全不相关。

 不确定性系数:表示用一个变量预测其他变量时的预测误差降低比例,取值在0~1,0表示完全不能预测,1表示预测完全准确。

⑧“有序”选项组:该选项组用于有序变量统计量的定制,包括4个复选框。

 Gamma:该统计量是对两个有序变量相关性的对称度量,取值在-1~1,-1表示变量之间完全负相关,1表示完全正相关,0表示完全无关。

 萨默斯d:该统计量是对两个有序变量相关性的非对称度量,取值在-1~1,-1表示变量之间完全负相关,1表示完全正相关,0表示完全无关。

 肯德尔tau-b:该统计量是对有序变量相关性的非参数检验,取值在-1~1,-1表示变量之间完全负相关,1表示完全正相关,0表示完全无关。

 肯德尔tau-c:该统计量同样是对有序变量相关性的非参数检验,不过计算时不考虑相同的观测值,取值同样在-1~1。

⑨“按区间标定”选项组:该选项组用于检验一个连续变量和一个分类变量的相关性,仅有一个Eta复选框,输出的是两个值,分别将列变量和行变量作为因变量进行计算,取值在0~1,0表示完全不相关,1表示完全相关。

图3-35 “交叉表:单元格显示”对话框

3.“单元格”设置

单击“单元格”按钮,弹出如图3-35所示的“交叉表:单元格显示”对话框。该对话框用于设置输出的统计量。

①“计数”选项组:该选项组用于对输出的观测值数量进行设置,包括3个复选框:

 “实测”复选框:表示按照变量观测值的实际数目显示。

 “期望”复选框:表示输出的是期望的观察值数目。

 “隐藏较小的计数(H)”复选框:表示且在“小于”文本框中输入数字,将隐藏小于该数的计数。

②“百分比”选项组:该选项组用于对百分比进行设置,包括3个复选框:

 “行”表示要输出行方向的百分比。

 “列”表示要输出列方向的百分比。

 “总计”表示要输出行或列方向总的百分比。

③“Z-检验”选项组:该选项组用于检验表中每列的比例是否相等,可设置输出拜弗伦尼校正后的检验显著性。

④“残差”选项组:该选项组用于对残差进行设置,包括3个复选框:

 “未标准化”表示输出的残差没有经过标准化处理,为原始残差。

 “标准化”表示输出的残差是经过标准化处理后的残差,即原始残差除以标准差后的残差。

 “调整后标准化”表示输出的是经过标准误差调整之后的残差。

⑤“非整数权重”选项组:该选项组用于对加权处理的非整数频数进行取整的设置,有5种方法:

 单元格计数四舍五入:表示对加权处理后的频数进行四舍五入取整。

 个案权重四舍五入:表示对加权处理前的频数进行四舍五入取整。

 截断单元格计数:表示对加权处理后的频数进行截断舍位取整。

 截断个案权重:表示对加权处理前的频数进行截断舍位取整。

 不调整,表示不对频数做任何调整。

4.“格式”设置

单击“格式”按钮,弹出如图3-36所示的“交叉表:表格式”对话框。该对话框用于设置输出结果的显示顺序。设置完毕后,单击“确定”按钮,就可以在SPSS Statistics查看器窗口得到交叉表格分析的结果。

图3-36 “交叉表:表格式”对话框