深圳市第五次国家卫生服务调查研究
上QQ阅读APP看书,第一时间看更新

第六节 数据质量与代表性

1.数据质量

玛叶指数(Myer's Index)是判断调查样本质量的一种方法。它假设在一个不存在任何数据偏好的人口中,以0~9中任何一个数字结尾的年龄别人数应该占总人口的1/10,实际人口年龄分布与理论分布差值的绝对值之和,称为Myer指数。Myer指数的取值范围为0~99,一般情况下认为Myer指数在60以下样本质量较好,大于60可以肯定该调查人口数据存在严重的年龄偏好即堆积现象。本次调查计算玛叶指数为42. 44(表1-2)。表明调查结果无年龄偏好,从年龄分布的随机性上来看样本质量较好。

表1-2 第五次卫生服务调查人口玛叶指数
2.数据代表性
(1)拟合度检验:

拟合度检验(Test of Goodness for Fit)是比较调查样本与总体是否相吻合的方法。以深圳市2010年第六次人口普查常住人口数据作为设计总体,观察样本数据与总体频数分布的拟合程度,判断样本对总体的代表性。表1-3说明抽样样本在年龄分布上与总体差异无显著性意义(X2= 27. 721,P = 0. 073),表明本次调查样本对深圳市总体常住人口有较好的代表性。

3. GINI集中比

GINI集中比(Gini concentration ratio,GCR)是反映样本分布与总体分布一致性的大小,不仅能判断样本对总体的代表性,同时也能反映抽样调查数据质量,GCR值在0~1之间,越小表明样本构成与总体构成的相似程度越高。

表1-3 调查人口构成拟合度检验(深圳市六普)

GCR的计算公式为:GCR BZ_14_916_1285_969_1347_94631 -(σPP)(σS-σS)」,其中σP和σS分别为ii -1ii -1ii总体和样本各年龄组所对应的累计百分比。

表1-4是实际调查对象年龄组人口分布与2010年深圳市常住人口总体分布的GINI集中比。结果显示:GCR为0. 066,样本与总体的差异较小,也可以理解样本住户人口分布与总体分布相差6. 6%。通过上述方法的检验和判断,可以认为这次调查样本对深圳市人口总体代表性较好。

表1-4 调查对象GINI集中比计算表
指数GCR = | 1 -0. 934 | =0. 066

因此,就样本质量和样本代表性而言,2013年深圳市第五次卫生服务调查家庭健康询问调查在设计与实施上有严密的论证和监督体系做质量保证,可以认为此次调查数据质量可靠,能代表性地反映深圳市卫生服务的整体情况和变化趋势。