医学统计方法学及SPSS软件应用(全国中医药行业高等教育“十四五”创新教材)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二节 调查设计

调查问卷是为了搜集人们对某个特定问题的态度、行为、观点和信念等信息设计的表格。问卷设计是研究者根据调查研究目的和内容的需要,编写问题并形成问卷的过程。回收率>70%时方可作为研究结论的依据。

一、设计原则与步骤

1.设计原则

(1)目的性 目的决定问卷的内容和形式。

(2)简明性 被调查者尽可能在较短的时间内了解问卷所提出的问题、较容易地进行回答。

(3)反向性 即问卷的设计与研究步骤恰好相反,问卷中的问题是在考虑了最终想要得到的结果的基础上反推出来的。反向原则能够保证问卷中的每一个问题都不偏离研究者的目的,而且在问题提出时已充分考虑了问题的统计分析方法。

(4)实用性 所用词句应简单、清楚,避免使用专业术语。

2.设计步骤(design process)

(1)确定研究目的 明确调查目的和说明目的的指标。

(2)建立问题库 由与调查有关的人员组成研究小组,采用头脑风暴法建立描述调查指标的系列问题。

(3)设计问卷初稿 根据研究目的和调查对象的特点,从问题库中选定若干问题,并安排它们的顺序。

(4)试用和修改 常采用两种方法:①客观检查法:选择部分人对问卷初稿填答,发现问题进行修改。②主观评价法:请该研究领域的专家、学者从不同角度对问卷进行评论。先用主观评价法,找出一些问题进行修改,再用客观检查法找出一些问题再次修改。

(5)检验效度和信度 参见本节“三、调查问卷的评价”。

二、问卷类型与结构

1.问卷类型

(1)开放型问卷 是由开放性问题组成的问卷,特点是受试者可以依据本人的意愿自由回答。

(2)封闭型问卷 是由封闭性问题组成的问卷,特点是受试者只能选择作答,有利于确定研究变量之间的关系,易于量化和统计分析。

(3)混合型问卷 是对答卷者的回答作部分限制,另一部分让其自由回答,或者对答案的数量进行限制,内容不设限制的一种问卷。

2.问卷结构 问卷一般包括封面信、指导语、问题、答案和编码等部分。

(1)封面信 封面信中需要说明的内容是:①我是谁(who)?②要调查什么(what)?③为什么要调查(why)?④这次调查有什么用(role)?⑤致谢。

(2)指导语 即对如何填写问卷、如何回答问题、填写的要求、方法、注意事项等作一个总的说明。

(3)问题和答案 问题可分为三类:①特征问题;②行为问题;③态度问题。

(4)编码 赋予每一个问题及答案两个数字作为它的代码,以方便输入计算机进行处理和分析。在实际调查中,编码一般放在问卷每一页的最右边。

三、调查问卷的评价

1.问题的类型

(1)开放式问题 即由问答者自由填写答案。

优点:①可用于事先不知道问题答案有几种的情况。②可让回答者自由发挥,得到意外的发现。③若问题和答案太长时用开放式提问为好。

缺点:①要求回答者有较高的知识水平和语言表达能力。②需花费较多的时间和精力。③不善用文字表达自己的看法时回答率低。④统计处理比较困难。

(2)封闭式问题 是在提出问题的同时,还给出若干个答案,要求被调查者选择其中之一作为问答。

优点:①容易回答,节省时间。②回收率较高。③更能获得相对真实的回答。④便于分析和比较。

缺点:①某些问题的答案不易列全,回答偏倚。②提供了猜答和随便选答的机会。③容易发生笔误。

(3)混合式问题 是在封闭式问题和答案后加一项“其他”,由被调查者在预留的空白处自由表达与该问题相关的未尽内容。

2.答案设计

(1)填空式 在问题的后面留长短不一的空白让受试者自己填写。

例如:您有几个孩子?个

(2)二项选择式 是;否。适用于互相排斥的定性问题。

例如:您饮酒吗?(在适当方格内打√) ①饮酒 ②不饮酒

(3)多项选择式 应按顺序排列。

例如:您的婚姻状况是(在合适号码上打√) ①未婚 ②已婚 ③离婚 ④丧偶

(4)排序式 适于表示一定先后次序、重要性或强弱程度的等级排列问题。

例如:开窗通风情况 ①天天 ②经常 ③偶尔 ④从不

在答案设计中应注意的问题:①问卷设计者与调查者对概念的理解不一致。②一个题目只包括一个内容。③使用通俗语言。④避免出现带有某种倾向的暗示性问题。⑤避免提问敏感性问题。⑥避免使用否定提问。

3.问题的排列顺序 应注意问题的逻辑顺序排列。①时间顺序问题,应按由近到远顺序排列。②应遵循由浅到深、由易到难的顺序排列。③应注意问题逻辑顺序。④先提问具体的问题,再提问抽象性的问题。⑤开放性问题应放在问卷后面。

4.信度和效度的评价 在调查研究中,对调查问卷的结果进行统计分析之前应先对其信度和效度进行分析,只有信度和效度在可以接受的研究范围之内时,调查问卷的统计分析结果才是可靠和准确的。

(1)信度(reliability) 主要评价量表的准确性、稳定性和一致性,即测量过程中随机误差造成的测定值的变异程度的大小,以相关系数r表示,称为信度系数。信度系数高表明测量的一致性程度高,测量误差越小。

信度分析通过研究测量数值和组成研究项目的特性,剔除无效的或者对研究对象作用较小的项目,从而提高数据的可靠性。信度可分为内在信度和外在信度两类。

内在信度:指调查表中的一组问题是否测量的是同一个概念。如果内在信度系数在0.8以上,则可以认为调查表有较高的内在一致性。常用的内在信度系数为Cronbach α系数和分半信度。

Cronbach α系数用于判断量表的内部一致性。Cronbach α系数可被看作相关系数,即该量表与所有含有其他可能项目数的量表之间的相关系数。其大小可以反映量表受随机误差影响的程度,反映测试的可靠程度。系数值越大,则量表受随机误差的影响较小。

分半信度(split-half reliability)是将调查的项目按前后分成两等份或按奇偶题号分成两部分,然后计算两部分各自的信度以及它们之间的相关性,来衡量整个量表的信度,相关性高则表示信度好,相应的信度指标即为分半信度。如果分半信度很高,则说明调查结果信度高。

外在信度:指在不同时间进行测量时调查表结果的一致性程度。外在信度指标是重测信度,即用同一问卷在不同时间对同一对象进行重复测量得分的简单相关系数r。一般认为,信度系数如果在0.9以上,则信度较好;信度系数在0.8~0.9是可接受的;在0.7~0.8,则该量表应进行较大修订;如果低于0.7,则需要重新设计了。

(2)效度(validity) 主要评价量表的准确性、测定有效性和正确性,即测定值与目标真实值的偏差大小。效度反映某测量工具是否有效测定到了它所打算测定的内容。常用的指标有:表面效度、内容效度、标准效度、结构效度、区分效度。

①内容效度:指调查问卷所采用的题项能否代表所反映的内容或主题。通常是用单个问题的得分与总得分的相关系数来反映,如果相关系数不显著,表示该题的鉴别力低,就不应该再将该题纳入调查问卷。

②结构效度:指测量结果体现出来的某种结构与测值之间的对应程度。结构效度采用的方法是因子分析。为了检验问卷中属于相同理论概念的不同问题是否能落在同一因子上,如果能够做到符合理论,即属于相同概念的题都归为同一因子,则说明问卷有着很好的结构效度。

③准则效度:是先根据已经掌握的理论,选择一个与调查问卷直接相关的独立标准,把它作为自变量。然后再分析调查结果的特性与该自变量的关系,如果对于自变量的不同取值,调查结果的特性表现出显著差异与我们掌握的理论有很强的相关性,则说明调查问卷是有效的。

(3)效度和信度的关系 效度比信度有更高的要求,信度是效度的必要条件,有效度必定有信度,效度高信度必定也高。信度是为效度服务的,因而效度是信度的目的;效度不能脱离信度单独存在,所以信度是效度的基础。信度和效度是一项科学研究活动和结果,具有科学价值和意义的保证。研究信度是研究效度的一个必要前提,没有信度,效度不可能单独存在。

四、调查研究的样本量估计

调查研究应根据调查目的、调查对象范围和调查条件来确定调查方法。采用抽样调查时,关键要考虑的问题是估计样本含量,其目的是在保证调查结果具有一定可靠性的前提下,确定最少的样本例数。在估计样本含量时,一般要考虑几个因素:①患病率的高低。②容许误差,即对调查研究要求的精确性。③控制容许误差的概率,即显著性水准α,一般取α=0.05。

样本含量的估算是根据已知条件或确定的条件代入样本含量估计公式计算而确定样本含量。抽样方法不同,则计算样本含量的方法亦不同。各种抽样方法的抽样误差一般是:整群抽样≥单纯随机抽样≥系统抽样≥分层抽样。以下介绍两种抽样调查估计总体均数和总体率的样本估计方法。

1.估计总体均数的样本量估计 确定α后,令δ为期望估计误差的最小值,σ为总体标准差,其样本量的计算公式为

n=(zασ/δ)2

(公式2-11)

【例2-12】某医生拟用整群抽样方法了解本地区成年女性血色素的平均水平,希望误差不超过3g/L,根据文献,血色素的标准差约为25g/L,如α=0.05(双侧),问至少需要调查多少人?

本例:z0.05/2=1.96,δ=3,σ=25,代入公式2-11得

n=(1.96×25/3)2=266.7≈267

故至少需要调查267人。

2.估计总体率的样本量估计 其计算公式为

(公式2-12)

【例2-13】根据我国18岁及以上成人高血压患病率为18.8%,某医生欲了解本地18岁及以上人口的高血压患病率,希望误差不超过2%,问至少需要调查多少人?

本例:α=0.05(双侧),z0.05/2=1.96,δ=0.02,π=0.188,代入公式2-12得

n=1.962×0.188×(1-0.188)/0.022=1466.1≈1467(人)

故至少需要调查1467人。