上QQ阅读APP看书,第一时间看更新
第二节 调查设计
调查设计是对观察性研究所作的周密计划,包括明确研究目的、确定研究对象、选择研究方法、制定调查表、计算样本含量、观察性研究资料的现场收集、整理和分析全过程的统计设想和合理安排。其目的是用尽可能少的人力、物力、财力和时间,获得具有科学意义且符合统计学要求的调查资料,得出合理的结论。
调查设计的要点是将调查研究的目的分解为拟分析的指标,再将分析指标分解为可调查的项目,并制定相应的调查问卷或采用其他调查测量技术进行资料的收集、整理和分析。
一、制订调查计划
(一) 确定调查目的与对象 1.明确调查目的和分析指标
调查是统计工作的有机组成部分,是统计工作的基础环节。调查设计依据调查研究目的进行。调查研究目的需要通过具体分析指标来实现。例如,某地区艾滋病感染率高于全国水平,拟调查该地区成年居民对艾滋病的相关知识、态度和行为现况,为进行艾滋病健康教育干预提供科学依据。为实现调查目的,首先需将其分解为具体指标,如:该地区不同社会人口学特征(例如:年龄、性别、文化程度等)成年居民对艾滋病相关知识的知晓率,对艾滋病病毒感染者、艾滋病患者、婚前性行为、婚外性行为等的态度,艾滋病相关危险行为的发生率、安全套使用率等。随后将计算这些指标所需资料列为调查项目,依据这些具体项目去收集资料,通过分析这些具体指标达到调查目的。
调查目的与具体研究指标二者的关系是:研究指标要依据调查目的来选定,而调查目的要能被研究指标充分体现。应该注意的是:对于研究指标的选定,应遵循围绕目的、重点突出、避免贪多求全、分散精力的原则。
2.选定调查对象
调查对象的选定应在确定调查目的和指标的基础上进行,明确调查总体同质范围,对于参数估计非常重要。观察单位可以是一个人、一个病例、一个家庭、一个集体单位,也可以是“人次”或“采样点”等。如上述某地区的艾滋病的相关知识、态度与行为的调查,总体的同质范围是该地某年全部成年常住人口,观察单位是“人”,观察对象只限于同属该地区和时间范围的常住成年人。
通常在明确调查对象后,还应该进一步细分对象人群,如具有不同社会人口学特征的调查对象、某种疾病的高危人群等,这样有利于掌握更全面而深入的资料。
(二) 确定调查项目与调查方法 1.确定调查项目
根据具体的分析指标确定对每个观察单位的调查项目,包括分析项目和备查项目。分析项目是直接用于计算调查指标,以及分析时排除混杂因素影响所必须的内容。例如,在上述的艾滋病调查中,为了获得成年居民对艾滋病相关知识的知晓率,调查项目应该包括每一位调查对象对艾滋病相关知识的掌握情况,如:“是否知道艾滋病的主要传播途径”,“感染了艾滋病病毒是否可以治愈”等。备查项目是为了保证分析项目填写的完整、正确,便于对其核查、补填和更正而设置的,通常不直接用于分析。
调查项目要精简,分析项目应保证调查获取数据的完备性与可获得性,而备查项目则不宜过多,不必要的项目坚决不要。调查项目的定义要准确,描述要通俗易懂,便于调查对象的理解、避免混淆误解,必要时要对某些项目附加说明,以便统一标准。
2.选用调查方法
明确调查对象后,应该考虑采用什么样的调查方法来获得目标对象,同时考虑通过什么样的调查工具来获得每一位调查对象的相关资料。因此必须选定适宜的调查方法和资料收集方式。
一般来说,研究者可根据不同的调查目的选用不同的调查方法来获得目标对象。了解总体参数,可用普查或抽样调查;说明事物的典型特征,可用典型调查。实际工作中将普查/抽样调查与典型调查方法结合应用的情况也颇为常见。例如,可以通过普查获得某地成年居民对艾滋病相关知识的知晓率;亦可用抽样调查来估计该地成年居民对艾滋病知识的知晓率。若要了解某病的发生与个人的某些社会人口学特征、生活方式、既往经历、周围环境等有无联系,常用病例对照研究,也可用队列研究来进行追踪调查,进一步验证疾病发生的关联因素。
资料收集方式主要有两大类:直接观察法和采访法,通常是二者结合一起使用。
(1) 直接观察法:
直接观察法是由调查人员到现场对被调查对象进行直接观察、检查、测量来获得相关资料。如在青少年肥胖研究的调查中,调查员直接对青少年进行身高、体重、腰围及皮褶厚度等的测量;在血吸虫病的调查中,医务人员到现场进行体检并收集便样、血样,进行生物医学检测等。直接观察法取得的资料比较真实可靠,但需要投入较大的人力、财力,不太适合大范围的人群调查。
(2) 采访法:
采访法是根据被调查对象的回答来收集资料。常用采访方式有三种:①访谈(interview):即通过调查员按照拟定的调查问卷向被调查对象进行口头询问,然后将调查对象的回答填入问卷,该方法可以保证被调查对象对问题的理解与设计要求基本一致,保证调查资料的质量;②焦点小组访谈(focus group):即通过召集部分知情人就某一个专题进行讨论的方式来收集与研究内容相关的资料;③信访:即将调查问卷邮寄给被调查对象,请他们填好后寄回,如病例随访调查等。本方法节省人力、财力,但由于缺少直接沟通,被访者可能会因对问题理解不清,产生信息偏倚。同时还存在失访,以致影响调查资料的质量。
3.确定样本含量
采用抽样调查方法时,需要在计划阶段估计样本含量(sample size),样本含量的估计保证了调查研究有足够的效能发现疾病与各种影响因素之间的关系,保证了研究结果的可靠性与呈现性。样本含量估计方法详见第六章。
(三) 制订资料整理与分析计划
通过现场调查收集到的原始资料只有经过整理与分析,去粗取精,去伪存真,才能揭示出事物的本质和规律。因此,在调查设计阶段对于资料的整理、分析也要有科学的计划,其内容包括以下方面:
1.调查问卷的回收与核查
调查问卷的回收是整理工作的第一步,要认真管理好收回的调查问卷,并作好专门记录,全面掌握问卷的回收情况。
调查项目的核查工作是调查问卷回收过程不可或缺的工作环节,主要包括完整性核查和逻辑核查。完整性核查是对调查问卷的所有项目进行检查,核对是否有漏填项,缺项内容应立即补填。完整性核查一般应在调查现场进行,以免问卷收回后某些数据弥补困难。逻辑核查主要检查调查内容逻辑上的矛盾,如入院日期与死亡日期的矛盾,患疾病种类与性别、年龄等不符的情况等。有些逻辑核查可在数据录入后,由计算机自动核查。
2.数据编码和录入
数据编码即对每条调查项目的所有可能调查结果分配一个代码。在问卷设计时的编码为事前编码,编码要方便调查员和被访者对调查条目的理解和作答。在数据收集后的编码为事后编码,主要针对调查问卷中的开放性调查项目,将调查中的各种回答进行比较,归纳整理出回答内容的主要类型,给予恰当的编码,便于计算机录入和识别。
3.设计数据整理表和数据分组
根据研究目的和预期分析指标设计数据整理表和数据分组,它既使调查目的更加具体、明确,又是预期结果的表达形式。
数据分组有两种,即①类型分组:又称质量分组或品质分组,是按资料的性质或类别进行分组,如将观察单位按性别、职业、疾病分组,某项检查结果的阳性或阴性等分组;②数量分组:即按分组因素的数量大小来分组,如将观察单位按身高的长度、体重的重量等分组。数量分组的多少因研究目的、资料性质和样本含量而定。分组的界限应清楚,不应重叠。当还不太了解研究现象的变化规律时,设计分组可先分得细一些,分析时再按实际情况作必要的并组。在调查设计中通常将两种分组方式结合使用。
4.数据汇总
数据汇总即按拟定的整理表和分组要求,将原始资料分别归入各组。一般采用计算机汇总,资料少时亦可手工汇总。
5.数据分析
在数据分析计划中,应说明研究指标的内涵和计算方法。为了达到研究目的,预期要做什么样的统计描述和推断,还需要做哪些探索性分析,对于混杂因素应采用什么样的统计方法来控制等。总之,设计一定要瞻前顾后,洞察全局。如果设计不周,顾头不顾尾,往往带来资料分析时难以弥补的缺陷。
(四) 制订调查的组织计划和质量控制方案
在调查的计划阶段,除了以上技术性的设计外,还应该考虑调查的组织计划,一般包括组织分工、时间进度和经费预算等。特别是大规模的协作调查,有明确的组织计划才能使各协作单位步调一致,在有限的经费内按前期既定的时间表完成总结。
质量控制是保证研究成功的基础。在调查计划方案中,应设计调查的质量控制措施和监督机制,包括质量控制的组织机构设置、质量控制方法、建立质量控制的监督机制等。
二、常用抽样方法
医学研究通常是从总体中按照一定的抽样方法抽取一定数量的观察单位组成样本,然后通过样本信息来推断总体特征。抽样调查比普查涉及的观察单位数少,因而节省人、财、物及时间,如果事先进行严密周全的设计,可获得较为深入细致和准确的资料。
(一) 抽样框与抽样设计 1.抽样框
在实际研究中,有时很难实现目标总体中的每一个观察单位都有相等的机会被抽取到,因此通常只能在目标总体中的一部分观察单位,即所谓研究总体中进行随机抽样,由这部分观察单位所构成的集合称为抽样框(sampling frame)。在抽样过程中必须对抽样框有一定的了解,以保证抽样框中的每个观察单位被抽中的概率相同。例如:一般都必须知道抽样框中基本单位的某些特征,如姓名、电话、地址等,这些名目就是抽样框清单(sampling frame list)。也就是说,抽样框应包括具体的清单以及能够计数的全部抽样单位。
2.抽样设计
在实际工作中主要有概率抽样设计和非概率抽样设计两种。概率抽样(probability sampling)也称随机抽样(random sampling),是指在总体中,每个观察单位都有被抽中的可能,任何一个对象被抽中的概率是已知的或可计算的。概率抽样方法有统计的理论依据,可计算抽样误差,能客观地评价调查结果的精度,在抽样设计时还能对调查误差加以控制。非概率抽样(non-probability sampling)是相对于概率抽样而言的,非概率抽样的共同特点是样本的抽选不是按随机的原则进行的;缺点是不能从样本对总体进行推断,不能根据样本计算抽样误差,因而不能从概率意义上控制误差并以此来描述估计的准确性。同时,非概率抽样具有快速、便利、经济等优势,常被用于探索性研究或预调查中。有时,非概率抽样是唯一可行的选择,对于特定研究、特殊人群,具有一定应用价值。
(二) 概率抽样
调查研究中常用的概率抽样方法有以下几种:
1.单纯随机抽样
单纯随机抽样(simple random sampling)又称简单随机抽样,是指所有观察单位有同等的概率被抽中的抽样方法,即按等概率原则直接从含有 N个观察单位的总体中抽取 n个观察单位组成样本( n<N)。
单纯随机抽样的一般步骤为:①将调查的抽样框中全部观察单位进行编号;②用抽签或随机数字等方法在抽样框中随机抽取部分观察单位组成样本。
例2-1
某社区有糖尿病患者40人,在对他们进行糖尿病相关知识的健康教育干预后,欲抽取10名患者评估干预效果,可采取单纯随机抽样。
方法:先将40名糖尿病患者进行编号,即1~40号,然后用附表1(随机数字表)中的随机数字,从任意一个随机数字开始(比如从第一行第一列的两位数22开始,按纵向(也可横向)依次读取10个数字(每个数字必须≤40,有相同者跳过),即22,19,16,03,23,15,36,18,09,12,于是冠以这些编号的糖尿病患者被抽中作为评估对象。
单纯随机抽样是最基本的抽样方法,也是其他抽样方法的基础。优点是统计指标的计算简便。缺点是当总体观察单位较多时,要对每个观察单位逐一编号,工作量大,实际工作中有时难以实现。
2.系统抽样
系统抽样(systematic sampling)又称机械抽样,它是将总体中的观察单位进行编号排序后,再计算出某种间隔,然后随机抽取一个随机数,确定第一号的观察单位,再按照编号先后顺序等间隔地抽取其他观察单位,将所有被抽取的号码来组成样本的方法。如欲了解某公司新招职员的健康状况,拟在1000名新职员中抽取200人作样本进行评估,其抽样间隔为1000/200 = 5,那么可以先对新职员进行编号或利用工号进行排序,如随机抽取的第一号为3,以后每隔5个观察单位抽取下一个观察单位,抽满200个观察单位为止。则抽取的观察单位编号依次为3,8,13,18,23,……,1003。
系统抽样的优点是:①易于理解,简便易行。②方便得到一个按比例分配的样本。由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。系统抽样特别适合抽样对象已经有现成的抽样框清单,例如职工有工资号,学生有学号,居民有街道门牌号等。
系统抽样的缺点是:①当总体的观察单位按顺序有周期趋势或单调增(减)趋势,则系统抽样将产生明显的偏性,也缺乏代表性。②实际工作中一般按单纯随机抽样方法估计抽样误差,但系统抽样抽取各个观察单位并不是彼此独立的。值得注意的是,对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须遵守,不得随意更改。
3.分层抽样
分层抽样(stratified sampling)又称分类抽样或类型抽样,是先将总体中的所有观察单位按某种特征或标志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成样本。如调查某市小学生的近视率,可按地域分为几个教育行政区,再在每个区内随机选择几所小学,然后在被选的小学中又可以在每一个年级随机选择几个班,最后由所有被选的观察单位作为研究的样本。
分层抽样的优点是:①抽样误差较小,分层后增加了层内的同质性,因而可导致观察值的变异度减小,各层的抽样误差减小,其标准误一般均小于(样本含量相同时)单纯随机抽样、系统抽样和整群抽样的标准误;②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施;③可对不同层的样本独立进行分析。
分层抽样的缺点是所获结论仅适用于同一分层条件相同的其他对象,因此有局限性。另外,由于抽样方法的需要,抽样前要有完整的研究对象资料,增加了工作的难度。
4.整群抽样
整群抽样(cluster sampling)是先将总体分成若干群体,形成一个抽样框,然后从中随机抽取若干个群体,由所抽得的若干个群体内的所有观察单位构成调查的样本。例如,调查某湖区居民血吸虫病的感染状况,可按自然村或行政村分为若干群体;再随机抽取若干个村;然后对被抽取的村里所有的居民进行调查。
整群抽样中对群体的抽取可采用简单随机抽样、系统抽样或分层抽样的方法。整群抽样与前几种抽样的最大差别在于,它的抽样单位不是单个的观察单位,而是成群的观察单位。“群”的大小是相对的概念,可以是自然的区划,也可以是人为的区划。每个群内的观察单位数可以相等,也可以不等,但相差一般不应太大。
整群抽样的优点是便于组织,节省经费,容易控制调查质量。缺点是当样本含量一定时,抽样误差一般大于单纯随机抽样的误差。群间差异越小,抽取的“群”越多,精度越高。因而在样本含量确定后,宜增加抽样的“群”数而相应地减少群内的观察单位数。
5.多阶段抽样
前述的四种基本抽样方法都是通过一次抽样产生一个完整的样本,称为单阶段抽样。但在现场调查中,往往面临的总体非常庞大,情况复杂,观察单位很多,而且分布面广,很难通过一次抽样产生完整的样本,而是根据实际情况将整个抽样过程分为若干阶段来进行,各阶段可采用相同或不同的抽样方法,这种抽样方法叫多阶段抽样(multi-stage sampling)。
(三) 非概率抽样
常用的非概率抽样方法有偶遇抽样、判断抽样、定额抽样、雪球抽样等。
1.偶遇抽样
偶遇抽样(accidental sampling)又称为方便抽样(convenience sampling),是指研究者根据现实情况,以便利的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。如在调查普通人群对非典型性肺炎的知晓程度时,以人口聚集的车站或街头的来往行人为观察单位进行相关调查。
2.判断抽样
判断抽样(judgmental sampling)又称立意抽样(purposive sampling),是调查者根据研究的目标和自己主观的分析来选择和确定调查对象的方法。如要调查女性性工作者在性交易中安全套的使用状况,由于性交易是极其隐蔽的行为,一般性工作者也不愿暴露自己的身份,因此无法知道女性性工作者的总体范围,不可能采用随机抽样的方法。在这种情况下,只能是找到符合条件的对象便对其进行调查,在样本含量达到一定时进行资料分析。
3.定额抽样
定额抽样(quota sampling)也称为配额抽样。在进行定额抽样时,研究者要尽可能地依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例,比偶遇抽样略为复杂。如欲了解某社区居民对医疗保险的意愿,已知该社区有60%的居民已参保,尚有40%的居民未参保,若调查200人,则应调查120名参保者和80名未参保者。定额分配后,可在两部分人群中任意选定调查对象。
4.雪球抽样
当无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的对象人群,再去找那些人并再询问他们知道的对象人群,如同滚雪球一样,可以找到越来越多具有相同性质的对象人群,直到达到所需的样本含量,这种抽样方法称为雪球抽样(snowball sampling)。
5.应答推动抽样
应答推动抽样(respond-driven sampling)是在雪球抽样基础上加以改良而形成的一种抽样方法。主要针对难以接近人群,如静脉注射吸毒人群、男同性恋人群、性工作者等。
应答推动抽样方法和经典链式推举法类似,首先在目标人群中选取一定数量的“种子”对象,然后通过“种子”对象的推举(一般为2~4人/人),获得一级抽样人群,再通过一级抽样人群获得二级抽样人群,在 n级抽样后,最终会得到一个稳定的目标人群的样本。应用马尔可夫链理论和社会网络分析方法可以证明,当 n = 4~6时,抽样获取的样本特征就会趋向稳定并且对所研究的总体有较好的代表性。
优点为,与雪球抽样等链式推举法相比,应答推动抽样方法限定每个观察单位只能推选一定数目的应答者,使得推举链延长,避免了某一特征人群的过度抽样,使抽样样本具有较好的代表性。同时该方法可应用社会网络分析方法来计算抽样概率,可对研究对象的个人网络大小赋予权重,控制因过度抽样可能产生的偏倚。
缺点是观察单位之间必须存在已有的社会网络;联系卡发出后调查对象参加调查的时间难以控制;存在选择性非应答偏倚且很难控制等。
三、常用调查方法
依据不同的资料收集方式,常用的调查方法有问卷调查法、敏感问题调查法、访谈法以及医学检查等。
(一) 问卷调查法
以调查问卷为工具进行数据收集的调查方式统称为问卷调查,可分为自填问卷调查和他填问卷调查。
1.自填问卷调查
自填问卷调查指调查员将调查问卷发送/邮寄给被调查者,由被调查者自己阅读和填答,然后再由调查员收回的资料收集方法。可以通过个别发送、集中填答或电子邮件调查等方式进行,具体介绍见本章第三节。该方法的优点为节省时间、经费和人力;匿名性好;可避免某些人为误差。其缺点是问卷的回收率和填写质量有时难以保证;对被调查者的文化水平有一定要求,因而自填问卷法在文化程度较高的被调查群体中比较适用。同时,在成分单一的总体中比在成分复杂的总体中适用。
2.他填问卷调查
他填问卷调查是指调查员采取口头询问和交谈的方式,向被调查者了解调查问卷条目的方法。包括面对面访问法和电话询问法等,具体方法介绍见本章第三节。他填问卷调查的主要优点为调查的应答率较高,调查资料的质量较好,调查对象的适用范围较广。在通常情况下,它是一种以口头语言为中介、调查员与被调查者面对面的交往和互动过程。该方法的主要缺点有调查员和被调查者之间的互动有时会影响到调查的结果,匿名性比较差,费用较高,面对面访问法对调查员的要求更高。
(二) 敏感问题调查法
敏感问题(sensitive problem)是指涉及个人(或单位)的隐私或利益的问题以及大多数人认为不便在公开场合表态或陈述的问题,如:个人隐私、宗教信仰、性生活、性病、灰色收入等,有时还包括一些违法或犯罪的行为。在这类问题的调查过程中,如果使用直接调查的方式来获得被调查者的真实信息是很困难的,只有采取特殊的、科学可行的方法来提高应答率、降低不真实回答率,使调查结果真实可靠。
敏感问题调查的困难主要来源于被调查者担心自己的隐私被暴露,因此敏感问题调查能否获得满意效果的关键在于要消除被调查的这种恐惧心理,被调查者一旦确信自己的隐私不会被暴露,那么他们给出真实答案的概率就会增加,从而使调查结果接近于真实情况。敏感问题调查可采取以下几种方法。
1.改良问卷调查法
当调查问卷中涉及敏感问题的回答时,需对普通调查问卷的条目作一些修正或改良,主要包括:严密设计的调查问卷;用对象转移法或假定法来间接地询问敏感问题;附有协议或保密证书的问卷;对完成问卷者给予一定的物质奖励;封闭式不记名自填式问卷等。
2.随机应答技术
随机应答技术(randomized response technique,RRT)是指在调查过程中使用特定的随机化装置,使被调查者以一个预定的基础概率 P从两个或两个以上的问题中选择一个问题进行回答,除被调查者本人以外的所有人(包括调查者)均不知道被调查者的回答是针对哪一个问题,从而保护了被调查者的隐私,最后根据概率理论可以计算出敏感问题特征在人群中的真实分布情况。
常用的随机应答技术类型主要有:①用于二分类敏感问题调查的随机应答技术,主要包括:沃纳模型(Warner model)、西蒙斯模型(Simmons model)、改进后的单问题RRT模型、三个无关联问题的RRT模型。②用于多分类敏感问题的随机应答技术。③用于数量特征敏感问题的随机应答技术。下面以二分类敏感问题调查的RRT模型介绍随机应答技术的基本步骤。
(1) 两个相关问题的RRT模型(沃纳模型)
1) 针对某敏感问题提出两个相关联的问题:如调查已婚人群中婚外性行为的状况,可以提出这样两个问题:问题A.我有过婚外性行为;问题B.我没有婚外性行为。
2) 设计随机装置:如纸箱、布袋等,在其中放入红球和白球,两球的比例分别为 P和 1−P,红球与白球的比例接近1∶1,但不能等于1∶1,比如0.7∶0.3等。以红球代表问题A(即敏感问题),白球代表问题B(非敏感问题)。
3) 受试对象回答问题:在别人看不到的情况下,受试对象从随机装置中摸出一球,根据球的颜色不同分别按自身实际情况回答对应的问题。这样除回答问题的本人外,别人根本不知道她(他)回答的是哪一个问题,也就无法知道他(她)的真实情况,这样就保护了被调查者的隐私,又可得到被调查者的真实回答。回答完毕后将球放回并混匀,调查员则得到了一个回答“是”的人数比例 λ值。
4) 分析:根据概率论,计算出在被调查人群中具有某一敏感问题特征的人数比例。公式如下
λ = Pπ + (1−P)(1−π)
(2-1)
其中 λ为回答“是”的人所占的比例, P为红球的比例,1 −P为白球的比例, π是某些有敏感问题特征的人数比例, n为样本含量。根据上式得
(2-2)
π的方差为
(2-3)
总体π的95%可信区间为
(2-4)
本模型的优点是保密性极强,无论应答者回答“是”或“否”都不会暴露应答者的任何隐私。缺点是模型的方差较大,而且两个问题均为敏感问题,容易导致应答者的抵触情绪。
(2) 两个无关联问题的RRT模型(西蒙斯模型)
1) 设计两个不相关的问题:第一个问题针对敏感性问题,第二个问题针对敏感问题无关的问题。如问题A.你曾经吸过毒吗?①是,②否。问题B.你是猴年出生吗?①是,②否。
2) 设计一个随机装置:内置许多红、白两色的小球,红白球之比为0.6∶0.4,混匀。
3) 受试对象回答问题:在别人看不到的情况下,由调查对象从随机装置摸出1球,摸到红球则回答问题A,摸到白球则回答问题B,回答完毕后将球放回,调查员获得回答“是”的人的总比率 λ值。
4) 分析:根据概率论可得
λ = Pπ + (1−P)R
(2-5)
其中 λ是回答“是”的人的总比率, P为红球比例,1− P为白球比例, R是符合问题B特征的人数比例, π则是有敏感问题特征的人数比例, n为样本含量。由上式得
(2-6)
(2-7)
π的95%可信区间为
(2-8)
(三) 访谈法
调查者与被调查者面对面或通过电话交谈,以获取所需资料的方法称为访谈法。常用的方式有两种:
1.结构式访谈
调查者根据事先设计好的访谈问卷,逐条询问被调查者的方法叫做结构式访谈,又叫做访谈式问卷调查。
2.半结构和非结构式访谈
在调查中不是依照事先提出的问题按部就班地提问,而是调查者根据研究的主题,设计出要了解的主要问题的提纲,然后与被调查者进行交谈。在调查中,根据被调查者的反应情况,随时提出一些新问题,逐步深入主题。由于没有问卷的固定模式,交谈的内容有较大的灵活性,交谈的气氛比较随和,容易得到真实的回答。其缺点是,在访问中调查者很可能用自己的观点去影响回答者,造成访问者对回答的“诱导”作用。
在实际的调查中,通常将这两种方法结合应用。
(四) 医学检查
调查人员携带某些实验室仪器、材料、试剂或X射线机、B超等物理检查的医学仪器进入调查现场,根据调查目的对被调查对象的身体进行检查/检测,或者在现场采集血样、便样及尿样等生物医学标本的调查方式。该方法耗用的人力、物力和财力较多,但对于获取某些疾病在当地人群中分布情况的第一手资料十分重要。
四、调查的组织与实施
(一) 调查的组织
调查的组织工作包括协调各级相关领导、宣传动员群众、时间进度、地域划分、调查员培训,任务分工与联系,经费预算,调查表格和宣传资料的设计与准备,以及调查资料的检查(完备性、正确性)制度和汇总等内容。调查设计中必须对上述工作作出详尽的安排,对于在实施过程中可能出现的问题准备相应的应急预案,以便对调查过程中出现的问题及时修正或完善。
1.确定调查的时间与进度
调查时间包括调查时期与时点,时期指调查工作开始和结束的时间;时点指在某一确定时间的调查状况。不同的调查课题具有不同的最佳调查时间,如某地方病调查的最佳时间应是该地区人口流动最少的时期。此外,还应对调查的每一个具体调查项目所需的时间制定详细的进度表,以控制整个研究活动的进程。一个好的时间进度表应该是时间、地点、负责人员、调查活动和资源的整合。
2.确定调查经费和调查工具
调查经费的开支预算和使用及收集资料的调查工具也应在调查研究方案中作出计划和安排。调查经费一般包括现场调查费(含差旅费)、课题资料费、调查问卷印制费、资料处理费等。调查工具一般包括交通、通信、调查问卷、医学检查的仪器、数据处理的工具等。同时还包括一些与研究内容有关的宣传资料等。
3.确定调查机构和团队
主要是确定调查研究的组织和领导系统以及调查人员的选择、培训规划。一般采用设立调查委员会、领导小组、办公室等组织形式。然后根据调查任务的需要,确定调查人员的选择和培训方式。一项现场调查能否顺利进行并获得真实可靠的资料,与是否拥有合格的调查人员密切相关。因此,在调查设计中应该强调对调查人员的培训,培训方式可以是系统授课、现场模拟调查等等。
(二) 调查的实施
在调查实施过程中政府相关部门或企事业单位对该项工作的支持、配合是调查顺利实施的基本条件。其次要保证资金、调查人员按时足额到位,动员被调查对象积极参与项目,获得被调查对象的有效配合,从而保证获取现场资料的质量与进度。
在实施现场调查中应抓紧原始记录的检查、补查和修正,保证资料完整,即预定的观察单位无遗漏、无重复、调查项目填写无空缺、正确(调查项目填写无错误)等。及时总结经验,发现问题,及时改进,同时做好项目的过程评价与质量控制工作。
五、调查的质量控制
(一) 误差
调查的目的是了解总体的真实情况及其相联系的各种因素,但调查结果有可能偏离真实情况。调查结果与真实情况之间的偏差,就称为误差。一切误差不论其来源如何,都会使样本的标准差及标准误增大。在调查研究中,出现误差是多方面的,如果按误差的来源、误差的性质和误差的可控性等划分,主要可分为抽样误差和非抽样误差两大类。
1.抽样误差
抽样误差是指在抽样过程中,由于总体中各观察单位存在变异,致使样本统计量与总体参数存在差异。抽样调查中,抽样误差不可避免,但是有一定的规律,即样本含量越大,抽样误差越小。抽样误差的控制主要在设计阶段。为了减少抽样误差,必须注意:①力求使抽取的样本具有代表性;②具有一定数量的调查对象;③在抽样时必须随机化。
2.非抽样误差
非抽样误差是在调查设计、资料收集、整理和分析的整个过程中,各种人为因素或者偶然因素所造成的。在实际调查工作中,应结合具体问题仔细考虑各阶段可能出现的各种非抽样误差,并采取有效措施控制调查质量。
(1) 设计阶段:
非抽样误差可能来自:①调查分析指标选择不当。如用回顾性调查了解某地居民肺癌的发病情况,那么在未采用有效防治措施前,该病发病率和死亡率是很接近的,如果用调查发病率来比较防治前后的变化就会比调查死亡率的误差大一些。②调查对象的范围划分不当。如调查某地居民孕产妇的死亡率,仅以该地有常住户口的人数为调查对象,以致对户口不在该地而长期留住该地的人不查,户口在该地而长期外出的人无法调查,这对于一个人口流动性较大的地区来说,对调查质量的影响是很大的,特别是流动人口中孕产妇的死亡率一般高于当地居民。③调查项目的定义不明确。如某地妇女活产史调查,规定只填写调查对象所有的亲生子女,如果不考虑非婚生育子女数或不考虑被他人抚养的子女数,则会带来误差。为此,应有详细的、明确的填表说明。④周岁年龄计算不准确。医学调查常涉及调查对象的周岁年龄,但计算年龄的习惯有公历、阴历、干支、属相、旧纪(民国、宣统、光绪)不同,有虚岁、实岁之分,为了控制误差,可编制按公历计算的周岁年龄对照表。⑤未编制周密的逻辑核检与计算核查提纲,可能会影响资料的核查效果。
(2) 调查阶段:
非抽样误差可能来自:①调查人员的责任感不强,业务水平不高。②调查对象因故漏查、躲避调查、拒绝回答、有意隐瞒、记忆不清等。为此,应广泛开展宣传,争取调查对象积极配合,家访要摸清调查对象在家规律,并做必要的补查;对敏感问题要进行细致的思想工作,注意保密,或从侧面了解,或用敏感问题调查法,对记忆不清者可请知情人、同龄人帮助回忆。
(3) 分析阶段:
非抽样误差可能来自编码、录入、汇总、计算等方面的错误。为此,应严格地进行资料清理和核对,及时发现和更正错误。
(二) 质量控制
为了保证调查过程的质量,应该在调查的各个环节加强质量控制,力求减少误差。
1.调查设计阶段
(1) 在调查设计时,首先应正确确定目标总体。例如,在调查某社区居民获得城市社区医疗机构服务的就诊率时,目标总体应该是该社区有常住户口的居民和流动人口的总和,而不应仅仅是有常住户口的本地居民,特别是在流动人口数量较多的社区,不列入流动人口的统计将会造成较大偏差。
(2) 在作调查计划时,应明确定义调查项目,尤其是可能引起混淆的那些调查项目。如在人口生育状况调查时,应明确指出亲生子女应包括已婚生子女和非婚生子女,如果从伦理上的关系来反映生育状况,隐藏了非婚生子女的存在,就会给该种调查带来偏差。
(3) 问卷设计时应紧扣调查目的,合理设置调查问题,在众多问题中精选最具代表性的问题,这也是保证调查质量的重要环节。如在调查小学生眼卫生保健情况,可选择的问题包括课桌椅高度,读书、看电视和让眼睛休息的时间长短,是否在日常生活中有好的用眼卫生习惯,以及做眼保健操的习惯等,这些问题的设置在一定程度上均能体现小学生的眼卫生保健情况,但如果能够选择一个具有代表性的问题:是否有坚持做眼保健操的习惯,将有助于保证调查质量。
(4) 根据调查对象的特点,选择恰当的调查方式,以保证调查质量。例如对农村老年居民进行生活质量调查时,由于他们的知识水平和理解能力可能较低,宜采用由调查员逐一询问并代为填写问卷的方式。
(5) 预调查是问卷设计过程中以及正式调查实施之前的一个重要环节,有助于完善问卷设计和调查的顺利实施。小范围的预调查,可以检验问卷设计能否达到预期目的,设计是否合理和可行。根据预调查结果可以即时修改和完善问卷设计。此外,预调查也是调查员培训的重要环节。
2.现场调查阶段
由于现场调查是由调查员实施的,调查员的选拔和培训是关键。要注意选拔思想品质、工作作风、专业知识和实际经验都比较理想的调查员。要严格按照设计方案的要求进行培训,统一认识,掌握技巧,并通过预调查取得经验。对已经确定的观察单位不得随意更换。
3.资料整理与分析阶段
由于该阶段的非抽样误差可能来源于编码、录入、汇总和计算等方面的错误。为此,应采取有效措施严格进行资料录入、清理和核查,及时发现漏洞改正错误。