第三节 变量与统计资料的类型
一、变量的概念
变量(variable)是指观察单位的某种特征或属性,即研究的项目或观察指标。变量一般可分为两大类:数值变量与分类变量。数值变量为定量变量,一般为连续型随机变量(continuous random variable),即在某一区间可取任何值的变量,也可为离散型随机变量(discrete random variable),即在某一区间只可取有限的几个值的变量;分类变量为定性变量,为离散型随机变量,又可分为无序分类变量和有序分类变量,无序分类变量按质分类,有序分类变量则按等级顺序进行归类。
变量的观测结果称为变量值(value of variable)或观察值(observed value)。如观察某社区60岁以上男性舒张压水平,则“血压”为变量,舒张压测量值(如100mmHg)为变量值。
二、统计资料的类型
1.定量变量(quantitative variable) 包括:①连续型变量(continuous variable)是用定量的方法测量某项指标数值大小所获得的资料,数值大小可取实数轴上的任何实数,通常带有度量衡单位。如身高、体重、血压、红细胞数等。②离散型变量(discrete variable)是特定单位中取整数值大小的资料。如呼吸、脉搏、护理次数等。
2.定性变量(qualitative variable) 包括:①分类变量(categorical variable)又称名义变量(nominative variable)或计数资料 (enumeration data),是按观察对象的性质或类别不同进行分组,然后清点每组的例数所获得的资料。包括二分类资料(如男、女,阳性、阴性,有效、无效等)和多分类资料(如工、农、商、学、其他等)。②有序变量(ordinal variable)又称等级资料(ranked data)或半定量资料(semi-measurement data) ,是先按指标的量级不同进行分组,然后清点每组的例数所获得的资料。常见有序多分类资料,如尿蛋白浓度:-、±、+、++、+++,患者对护理工作的满意度:很满意、满意、不满意、很不满意等。
正确识别变量类型或资料分类,是针对不同资料选择正确统计分析方法先决条件之一。此外,有时需要根据研究目的对资料类型进行必要转换,原则是只能由高层向低层转化,定量→有序→分类→二分类,不能做相反方向转化。