上QQ阅读APP看书,第一时间看更新
五、统计分析方法和加权调整
(一)数据分析方法
本报告主要以年龄、性别、城乡和地区(东部、中部、西部)作为分层因素,采用率、构成比、均数等指标进行统计描述。为使调查结果能够代表全国60岁及以上老年人群,调查结果采用复杂抽样加权调整的方法进行调整,使用国家统计局公布的2010年全国人口数进行了事后加权。
全部统计分析使用SAS 9.3统计软件完成。
(二)加权调整
由于本次监测采用了不等概率抽样,根据抽样设计,对样本进行抽样加权;由于抽样造成的某些重要指标在样本与总体分布上的偏差(主要为年龄和性别的偏差),因此,也进行了事后分层调整。个人老年数据库和家庭老年数据库在抽样阶段上既有共同的阶段,也有各自不同的抽样阶段,所以分开说明。
1.抽样权重
按照本次监测的抽样设计,个人老年数据库中个体的抽样权重W sp如下:
wsp = ws1 × ws2 × ws3 × wsp4
家庭老年数据库中个体的抽样权重W sf如下:
wsf = ws1 × ws2 × ws3 × wsf4
在W sp和W sf的计算中,W s1、W s2和W s3是相同的。
W s1为样本县/区的抽样权重,其值为分层简单随机抽样下样本县/区抽样概率的倒数,全国城市地区按东中西、非农人口比例、人口数分为27层(其中,非农人口比例、人口数分别按照三分位数进行划分),农村地区按照东中西、GDP、人口数分为27层(其中GDP、人口数分别按照三分位数进行划分),共54层,其计算公式如下:
W s2为样本乡镇/街道的抽样权重,由SAS在PPS抽样过程中计算生成,其值为与人口数成比例的PPS抽样下样本乡镇/街道抽样概率的倒数。
W s3为样本村/居委会的抽样权重,由SAS在PPS抽样过程中计算生成,其值为与人口数成比例的PPS抽样下样本村/居委抽样概率的倒数。
W sp4为个人老年数据库中样本个体的抽样权重,其值为样本个体抽样概率的倒数,计算公式如下:
W sf4为家庭老年数据库的抽样权重,其值为样本家庭抽样概率的倒数,计算公式如下:
2.事后分层权重
无论是个人老年数据库还是家庭老年数据库,都要进行事后分层权重的调整。事后分层权重考虑的分层因素为:性别2层(男性、女性),年龄5层(60~64,65~69,70~74,75~79,80+),城乡2层(城市、农村),地区3层(东、中、西部)。将抽样权重加权的监测样本与全国样本按照分层因素分为60层,计算每层权重值的公式如下:
3.最终权重
个人老年数据库中个体的最终权重:w p = w sp × w a
家庭老年数据库中个体的最终权重:w f = w sf × w a