SPSS统计分析入门与应用精解(视频教学版)
上QQ阅读APP看书,第一时间看更新

1.4 变量和样本观测值的基本操作

下载资源:\video\第1章\1.4

下载资源:\sample\数据1\数据1

1.4.1 变量和观测值的移动、复制和删除

1.变量和观测值的移动

在“数据视图”窗口中,选择要移动的对象后,选择“编辑 | 剪切”命令,找到插入位置,然后选择 “编辑 | 粘贴”命令,就将剪贴板中的变量(或观测值)粘贴到空变量(或空观测值)的位置上了。

2.变量和观测值的复制

观测值可以复制,但变量不能复制,因为变量不允许同名。要复制观测值,只要把移动方法中的“剪切”改为“复制”命令即可。

3.变量和观测值的删除

选择要删除的对象后,选择“编辑 | 清除”菜单命令或单击键盘上的“Delete”键即可删除变量或观测值。

1.4.2 数据转置

在很多情况下,各类数据资料编辑的风格不同,需要对数据的行与列进行互换。利用SPSS数据的转置功能可以非常轻易地将原数据文件中的行、列进行互换,将观测值转变为变量,将变量转变为观测值。转置的结果是系统将创建一个新的数据文件,并且自动建立新的变量名显示各新变量列。数据转置的步骤如下:

· 以本书附带的数据1为例,首先打开数据文件,然后在菜单栏中选择“数据︱转置”命令,如图1.34所示。然后打开“转置”对话框,如图1.35所示,从左边变量框中选择要进行转置的变量,移入“变量”列表框中。比如本例中我们针对除y6之外的所有变量进行转置,就把左侧列表框中除y6之外的所有变量都选入右侧的“变量”列表框中。

图1.34 “数据︱转置”命令

图1.35 “转置”对话框

单击“确定”按钮,弹出如图1.36所示的提示信息,提示用户“未选择转置某些变量。未转置的变量将丢失。 ”需要注意的是,如果将原变量列表中的全部变量都进行转置,那么系统将不会弹出该对话框。

图1.36 数据转置确认对话框

单击“确定”按钮,转置后的新文件将取代原数据文件出现在数据窗口中,如图1.37所示。

图1.37 转置后的数据

1.4.3 变量计算

在建立数据文件时,通常仅包括可能来自统计调查的原始测量结果。有时需要对变量进行一定的加工,比如在研究学生的中考成绩与IQ值之间的关系时,可能需要先将学生文化课、体育课和实验课等成绩按照一定的权重进行计算,得到学生的中考总成绩,再与IQ值通过相关分析、回归分析等方法开展研究。有时在分析完之后要对数据进行深加工,比如完成因子分析之后,将观测值的各个因子得分乘以其方差贡献率得到因子总得分,进而开展后续研究等。SPSS提供强大的计算变量功能,新变量的计算可以借助计算变量功能来完成。以本文附带的数据1为例,如果我们要创建新的变量“发育”,其中体重、身高、坐高的权重各为30%、40%、30%,那么用“计算变量”命令计算新变量的步骤如下:

打开数据文件“数据1”,选择“转换︱计算变量”命令,如图1.38所示。打开“计算变量”对话框,如图1.39所示。

图1.38 选择“转换︱计算变量”命令

图1.39 “计算变量”对话框

输入计算表达式。使用计算器板或键盘将计算表达式输入“数字表达式”列表框中。表达式中需要用到的SPSS函数可从函数组中选择,通过双击鼠标左键或单击“函数和特殊变量”列表框左侧的箭头按钮,将选中的函数移入表达式栏。这时,栏中函数的自变量和参数用“?”表示,自变量必须选用当前工作文件中的变量,可以从左侧变量清单栏中选择,选中后用鼠标双击它,输入表达式中。本例中在“数字表达式”列表框中输入“y4*0.3+y5*0.4+y6*0.3”。

定义新变量及其类型。在“目标变量”文本框中输入目标变量名,既可以是一个新变量名,也可以是已经定义的变量名,甚至可以是表达式中使用的自变量本身。本例中我们在“目标变量”中输入“发育”,然后单击“类型和标签”按钮,弹出“计算变量:类型和标签”对话框,如图1.40所示。

图1.40 “计算变量:类型和标签”对话框

对话框深度解读

对于标签的设置有两种方式。

· 标签:可以在该文本框中给目标变量添加自定义的标签。

· 将表达式用作标签:使用计算目标变量的表达式作为标签,有利于统计分析时清晰地了解新变量的意义及运算关系。

在此对话框中,还可以对新变量的类型及宽度进行选择。本例中我们采取系统默认设置,选择确定后,单击“继续”按钮,返回“计算变量”对话框。

“计算变量:If个案”对话框的使用。有时候,仅仅需要对一些符合某些特定条件的自变量的观察值进行计算。例如,在数据文件“数据1”中,我们只需要计算女性的发育情况,即需选择满足条件“性别=2”的观测值来计算。当条件表达式“性别=2”为真时,将计算出女性的发育情况。使条件表达式为假的或缺失的观测量就不会计算这个值,对应这些观测量,新变量的值为系统缺失值。在“计算变量”对话框中单击“如果…”按钮,弹出“计算变量:If 个案”对话框,如图1.41所示。条件表达式的建立规则是:条件表达式中至少要包括一个关系运算符,也可以使用逻辑运算符,并且可以通过关系(或逻辑)运算符连接多个条件表达式。本例中,我们选中“在个案满足条件时包括”单选按钮,然后在下面的文本框中输入“y2=2”,即可仅计算女性的发育情况。

图1.41 “计算变量:If个案”对话框

单击“继续”按钮对设定的条件表达式加以确认,返回“计算变量”主对话框。各项选择确认后,单击“确定”按钮,系统将根据表达式和条件计算新变量的值,并将结果显示到数据窗口的工作文件中,如图1.42所示,变量视图中增加了“发育”变量。

图1.42 增加“发育”变量之后的变量视图

我们还可以在“数据视图”界面看到“发育”变量的具体数据值(见图1.43)。可以发现,只有女性(y2=2)的样本观测值才有发育数据(这与我们前面对表达式的具体设置有关),男性(y2=1)的样本观测值中发育变量数据都是缺失值。

图1.43 增加“发育”变量之后的数据视图