2.2.9 变量取值的求秩
有时我们想知道某一个观测在知道条件下的观测中的位置,而又不希望打破数据现有的排序,此时我们将用到变量取值求秩的功能。所谓变量取值的秩就是变量在某指定条件下的排列中所处的位置,秩反映了变量在有序序列里的位置信息,本书中以机器优良为例介绍变量取值求秩的操作方法,本例中要求按照机器产生的残次品得到机器的排名信息,如果残次品相同,则并列名次,未进行求秩的原始数据文件如图2-30所示。下面分析所用数据文件为2-4(数据文件路径:sample/chap02/案例/2-4)。
图2-30 未进行求秩的原始数据文件
变量取值求秩的具体方法如下。
(1)在菜单栏中依次选择“转换”|“个案排秩”命令,打开如图2-31 所示的“个案排秩”对话框。
图2-31 “个案排秩”对话框
(2)选择要重新赋值的变量。
选择要进行排秩的变量,单击 按钮将其选入“变量”列表中。如果需要进行分组,则需要选择分组变量,单击 按钮将其选入“排序标准”列表中,本例中将“残次品”变量选入“变量”列表,如图2-32所示。指定了分组标准后,系统会对各个组分别计算和输出变量的秩序。
图2-32 “个案排秩”对话框的变量选择
(3)进行相应的设置。
● “秩的类型”按钮。
单击“秩的类型”按钮,弹出如图2-33 所示的“个案排秩:类型”对话框。
图2-33 “个案排秩:类型”对话框
该对话框用于设置排秩的相关方法和参数。如选择“秩”复选框,则表示使用简单秩;如选择“Savage得分”复选框,则表示使用基于指数分布的Savage得分作为排秩的依据;如选择“分数秩”复选框,则表示使用秩除以非缺失观测量的权重和作为排秩的依据;如选择“%分数秩”复选框,则表示使用每个秩除以带有有效值的个案数,再乘以100的结果作为排秩的依据;如选择“个案权重总和”复选框,则表示使用各观测量权重之和作为排秩的依据;如选择“Ntiles”复选框,则表示使用百分位数作为排秩的依据,用户可以在其后的输入框中输入百分位数的个数。
如选择“比例估计”复选框,系统估计与特定秩对应的分布的累积比例;如选择“正态得分”复选框系统将输出对应于估计的累积比例的z得分。
当选择“比例估计”或“正态得分”复选框后,“比例估计公式”选项组被激活,用户可以选择使用的比例估计方法。
本例中选择“秩”复选框。
● “结”按钮。
单击“结”按钮,弹出如图2-34所示的“个案排秩:结”对话框。
图2-34 “个案排秩:结”对话框
该对话框用于设置对秩的取值相同的观测值的处理方式。如选择“均值”单选按钮,则表示以秩的均值作为最终的结果;如选择“低”单选按钮,表示以相同秩的最小值作为最终的结果;如选择“高”单选按钮,则表示以相同秩的最大值作为最终的结果;如选择“顺序秩到唯一值”单选按钮,则表示把相同的观测值作为一个值来求秩。
● “将秩1指定给”选项组。
该选项组用于设置秩的排列顺序,如选择“最小值”单选按钮,表示使用升序;如选择“最大值”单选按钮,表示使用降序,本例中选择“最小值”单选按钮。
● “显示摘要表”复选框。
如选择该复选框,在结果窗口中输出分析的摘要信息,本例中要求成绩相同者名称并列故选择“高”单选按钮。
(4)单击“确定”按钮,就可以对变量取值求秩。个案排秩的操作结果如图2-35所示。
图2-35 变量排秩后的操作结果
由图2-35 可以看出,变量的秩作为一个新的变量“R成绩”保存,这个变量给出了我们每个机器的优良情况。