1.4.1 数据类型的定义
数据包括常量和变量。常量指取值在一定阶段保持不变的量,如圆周率,SPSS中的常量包括数值型、字符型和日期型常量;变量指在不同的记录行取不同的值,即取值可变的量。
输入数据前首先要定义变量。定义变量即定义变量名、变量类型、变量宽度、变量小数、变量标签、变量值标签等。
1.定义变量名
SPSS默认的变量名为VAR00001、VAR00002等,用户可以根据自己的需要对变量进行命名。变量的命名有一定的规则,具体内容如下。
(1)必须以字母、汉字或字符@开头,其他字符可以是字母、数字或_、#、$等符号。
(2)不能使用空白字符和其他特殊字符(如!、?等)。
(3)变量名不区分大小写且必须唯一。
(4)用户定义的变量名不能以“$”为开头。以“$”为开头的变量名特指SPSS的系统变量,不可修改,而且在程序中不可用。
(5)避免最后一个字符是“.”,因为英文句点有时会作为命令的结束标志,若这样定义变量,则容易引起歧义。
(6)避免最后一个字符是“_”,因为下画线一般作为由程序或命令自动生成的变量名的结尾。
(7)SPSS的保留字不能作为变量的名称,SPSS的保留字有ALL、AND、WITH、NOT、OR、BY、EQ、GE、GT、LE、LT、NE、TO。若使用了上述保留字作为变量名,系统会提示。
2.定义变量类型
单击“类型”相应的单元格中的按钮,弹出“变量类型”对话框,如图1-6所示,在对话框中选择合适的变量类型并单击“确定”按钮,即可定义变量类型。
SPSS的变量类型包括数值型、字符型、日期型,具体介绍如下。
图1-6 “变量类型”对话框
1)数值型变量
数值型变量的长度是用字符个数度量的宽度,小数点和其他分界符也计算在内,常用的数值型变量如下。
●数字:可以定义数值的宽度和小数位数,SPSS默认的宽度和小数位数分别为8、2。数值的宽度包括整数部分的位数、小数点、小数部分的位数。
●逗号:指整数部分每3位数添加一个逗号,如“1,234.00”。
●点:以整数形式显示,每3位数加一点(这里不是小数点)。可以定义小数位数,但所显示的小数部分均为0,且小数点用逗号表示。如自定义小数位数为2,则“9.8765”显示为“9.88”。
●科学计数法:指数值在数据编辑窗口中以指数形式显示。如定义数值宽度为8,小数位数为3,则“123.456”显示为1.23E+02。
●美元:SPSS提供了多种货币显示形式,用户可根据需要选择,并定义数据宽度和小数位数。其值在显示时,有效数字前面带有“$”,输入时可以不输入“$”,显示时系统会自动加上“$”和分隔符。
●定制货币:默认显示为整数部分每3位加一个逗号,用户可以定义数据宽度和小数位数。如9876543.21显示为9,876,543.21。
●受限数值型:指输入的数值位数限制为所设定的数据宽度。假定数据宽度设为4,则“112233”显示为“2233”,而“11”显示为“0011”。
2)字符型变量
用户可以自定义字符长度以便输入字符,使用时须注意以下几个方面。
●SPSS区分短字符串和长字符串,短字符串最长8字节,一个长字符串大于或等于8字节,长字符串变量不能定义用户缺失值。有些分析过程可以处理短字符串,但不能处理长字符串。
●系统缺失值不能用于生成字符型变量。
●当生成新变量、修改原变量时,可能产生缺失值或未定义的变量值,这时系统自动赋予空值。变量值以空格表示时,若无特别定义,不能代表缺失值。
●字符型变量不能参与算术运算。
●字符串区分大小写字母。
3)日期型变量
SPSS中的日期型变量既可以表示日期,也可以表示时间。SPSS提供了多种日期显示形式,用户可根据需要选择。
3.定义变量宽度
系统默认宽度为8。单击宽度列中的某一单元格,将出现,单击上、下箭头可调节变量的宽度,也可直接输入数字。当变量类型为日期型时,变量宽度的设定无效。
4.定义变量小数
设置变量的小数位数,方法同变量宽度的设置。当变量类型为日期型时,变量小数位数的设定无效。
5.定义变量标签
变量标签是对变量名的进一步描述,可以输入120个字符,并且可显示大小写字母。变量标签可以显示在结果输出窗口中,便于在查看结果时理解变量的实际意义。
6.定义变量值标签
变量值标签是对变量的每一个可能取值的进一步描述,当变量是定性或定序变量时,变量值标签的描述是非常有用的。
例如,在统计分析中经常用1代表“男”、2代表“女”等。具体操作为:单击“值”相应的单元格右侧的,弹出“值标签”对话框,如图1-7所示;在“值”文本框中输入“1”,“标签”文本框中输入“男”;单击“添加”按钮即可完成变量值标签的添加。
7.定义缺失值
SPSS有两类缺失值:系统缺失值和用户缺失值。在实际工作中常会因为某种原因出现记录数据失真、没有记录等现象。
如在统计过程中,一些被调查者没有回答的题目都将标为用户缺失值。定义缺失值的具体操作为:单击“缺失”下面的某一单元格,弹出“缺失值”对话框,如图1-8所示,有以下三种定义缺失值的方法。
图1-7 “值标签”对话框
图1-8 “缺失值”对话框
●无缺失值,SPSS默认方式。若当前变量的取值完整,则选择此项。
●离散缺失值,可以指定1~3个离散的缺失值。例如指定20、95和88为缺失值。
●范围加上一个可选的离散缺失值,可以指定一个缺失值范围和一个离散的缺失值。
8.定义变量的显示宽度
SPSS默认为8,用户可根据需要进行设置。
9.定义变量显示的对齐方式
变量显示有左对齐、右对齐、居中对齐三种方式,SPSS默认为右对齐。
10.定义变量的测量尺度
可选测量尺度有以下3种。
●名义:一种分类变量,即它的取值只代表观测对象的不同类别,变量的取值之间没有内在的大小可比性,例如“性别”变量。
●有序:一种分类变量,变量取值之间有内在的大小顺序或等级。例如“满意度”变量的取值为1—很不满意、2—比较满意、3—非常满意,由小到大的取值代表满意度的提高。
●度量:又称定距变量或刻度变量,一般为有刻度度量的连续变量,它的取值之间可以比较大小,且可以定义距离,例如“年龄”“年份”等。
11.定义变量的角色
角色用于定义变量在后续统计分析中的功能,SPSS提供的角色选项有输入、目标、两者、无、分区和拆分。