2.5.3 数据文件的分解与合并
有时我们需要将变量按照指定的要求进行分组,例如按照地区分析销售人员的业绩,此时要用到数据的分解功能;有时我们需要将不同的数据文件组合形成一个新的数据文件,例如要将二班的成绩和一班的成绩放在一起形成总成绩表,或者把生物成绩追加到数学和物理成绩之后,此时我们将用到数据的合并功能。
1.数据文件的分解
所谓数据文件的分解,是指将该数据文件中的所有观测量以某一个或某几个变量为关键字进行分组,以便于集中对比和操作。本节将以销售人员的业绩分析为例讲解数据文件的分解操作,本例中我们按照地区划分销售人员的业绩,以分析不同地区的销售情况。分解前的数据文件如图2-16所示。
图2-16 分解前的销售业绩数据文件(销售量单位:万件)
通过图2-16我们可以看出,数据文件是按照销售量进行排序的,对各分区的业绩考核与排序则不够直观。
数据分解的具体操作步骤如下:
在菜单栏中选择“数据”|“拆分文件”命令,打开如图2-17所示的“拆分文件”对话框。
选择文件分解方式。选中“分析所有个案,不创建组”单选按钮,系统将不进行分组操作;选中“比较组”单选按钮,系统将把各组的分析结果放在同一个表格中比较输出;选中“按组来组织输出”单选按钮,系统将按分组单独输出分析结果。本例选中“按组来组织输出”单选按钮。
选择分组方式与显示方式。选中“比较组”或“按组来组织输出”单选按钮,分组方式列表和设置文件排序方式的两个单选按钮将被激活。在列表中选择排序依据变量,然后单击按钮将选中的变量选入“分组依据”列表框中。本例将按照地区进行销售业绩的评估,故选择“地区”变量输入“分组依据”列表框。
选择排序方式。如选中“按分组变量进行文件排序”单选按钮,系统会将观测量按分组文件的顺序进行排列;如选中“文件已排序”单选按钮,则表示文件已经排序,无须系统进行排序操作。本例中的数据文件未按“地区”变量进行分组,故选中“按分组变量进行文件排序”单选按钮。
单击“确定”按钮,即可进行文件分解操作。分解完成的数据文件如图2-18所示。
由图2-18可以看出,数据已经按照地区进行了划分,我们可以很方便地了解各个地区的销售情况并进行业绩评价。
图2-17 “拆分文件”对话框
图2-18 分解后的数据文件
2.数据文件的合并
数据文件的合并分为横向合并和纵向合并。横向合并是指从外部数据文件中增加变量到当前数据文件;纵向合并是指从外部数据文件中增加观测量到当前的数据文件中。
(1)数据文件的横向合并
数据文件的横向合并也分为两种情况:一种情况是将外部数据文件的变量追加到当前数据文件中;另一种是按共同的关键变量合并。本节以学生成绩添加为例讲解数据文件的横向合并。本例中,我们希望将学生的数学成绩添加到物理成绩之后形成学生的总成绩表。横向合并前的物理成绩与数学成绩的数据文件分别如图2-19和图2-20所示。
数据文件的横向合并的具体方法如下:
①在菜单栏中选择“数据”|“合并文件”|“添加变量”命令,打开如图2-21所示的“变量添加至”对话框。
用户可以选择已经打开的数据文件,或者从外部选择一个已经保存的SPSS数据文件作为与当前文件合并的文件,选择完后单击“继续”按钮。本例选中“外部SPSS Statistics数据文件”单选按钮,然后选择“数学成绩”文件,打开如图2-22所示的“变量添加自”对话框。
图2-19 学生的物理成绩
图2-20 学生的数学成绩
图2-21 “变量添加至”对话框
图2-22 “变量添加自”对话框
②选择合并后数据文件中的变量:“排除的变量”列表框用于显示不出现在新合并的数据文件中的变量以及当前数据文件和外部数据文件中的重名变量。
“包含的变量”列表框用于显示合并后的数据集中包含的变量。变量名称后面带有“+”的表示来自外部数据文件的变量,变量名称后面带有“*”的表示当前数据文件中的变量。如果用户希望将重名变量也加入合并后的文件,可以在“排除的变量”列表框中选择该变量并单击“重命名”按钮对其重新命名,再单击按钮将该变量选入“包含的变量”列表框中,本例无须对此进行操作。
③设置关键变量:如果两个数据文件具有相同的个案数且排列顺序相同,用户无须指定关键变量。否则,需要选择关键变量并以关键变量的升序对两个数据集进行排序。只有当前数据文件和外部数据文件中的重名变量才可以作为关键变量,选中“两个数据集中的个案都按键变量的顺序进行排序”复选框并选择该变量,单击按钮将其选入“键变量”列表框中,本例由于学生的成绩均按照学号进行排序,故不必指定键变量。
选中“两个数据集中的个案都按键变量的顺序进行排序”复选框将激活下面的3个单选按钮。
非活动数据集是键控表:表示将非活动数据文件作为关键表,即只将外部数据文件中与活动数据集中对应变量值相同的观测量并入新的数据文件。
活动数据集是键控表:表示将非活动数据文件作为关键表。
两个文件都提供个案:表示将两个数据文件的所有观测量合并。
④单击“确定”按钮,即可完成文件横向合并操作。由图2-23可以看出,数学成绩已经作为一个新的变量被添加到了学生成绩表中,我们得到了一个包含数学和物理成绩的成绩总表。
图2-23 横向合并后的数据文件
(2)数据文件的纵向合并
数据文件的纵向合并只能合并两个数据文件中相同的变量。本节同样以学生成绩添加为例讲解数据文件的纵向合并。与上一个例子不同,本例中我们希望将二考场学生的数学成绩添加到一考场学生的成绩之后形成学生的总数学成绩表,其中一考场为学号1~50号的学生,二考场为学号51~80号的学生。纵向合并前的两个考场学生的数学成绩数据分别如图2-24和图2-25所示。
图2-24 一考场学生的数学成绩
图2-25 二考场学生的数学成绩
数据文件纵向合并的具体方法如下:
①在菜单栏中选择“数据”|“合并文件”|“添加个案”命令,打开如图2-26所示的“添加个案至”对话框。
本例在“外部SPSS Statistics数据文件”下选择“二考场数学成绩”文件,然后打开如图2-27所示的“添加个案自 数据集2”对话框。
②进行相应的设置。“非成对变量”列表框中显示的是未能匹配的变量,“新的活动数据集中的变量”列表框中显示的是两个数据文件中文件名和数据类型都相同的变量。对于数据类型相同而名称不同的变量,用户可以通过选择这些变量后单击“配对”按钮来匹配两个变量。
③单击“确定”按钮,即可完成文件纵向合并操作。合并后的部分数据文件如图2-28所示。
图2-26 “添加个案至”对话框
图2-27 “添加个案自 数据集2”对话框
图2-28 纵向合并后的数据文件
由图2-28可以看出,一考场的数学成绩和二考场的数学成绩已经被合并了,学号为51~80号学生的数学成绩已经被合并到了一考场学生数学成绩的后面,形成了总数学成绩单。