第二节 抽样术语与抽样程序
一、抽样的概念和术语
抽样中常用到的概念与术语主要有:
1.个体与抽样单位:个体是收集信息的基本单位,即分析单位。个体可以是某种类型的人,也可以是家庭、组织、社区等。除此之外个体还可以是文化产物,例如文章、杂志、歌曲、词汇等。个体与抽样单位在有些研究中是相同的,但在实际抽样中,抽样单位往往是多层次的。例如,要调查家庭,可先在一个县抽选若干乡,然后从这些乡组成的样本中抽选某些村,最后从村样本中抽出家庭的样本。这时抽样单位是乡、村、家庭三种,分别称为初级抽样单位、次级抽样单位和终级抽样单位。
2.研究总体和调查总体。研究总体是在理论上明确界定的个体的集合体,它必须受几个方面的限定:内容、单位、范围、时间。例如一项关于妇女生育率的研究,如果未加界定,妇女只是个模糊的整体,还不是研究总体,只有经界定为“1988年年满15—49岁的中国妇女”后,才成为可用于调查的研究总体。研究总体是在理论上明确定义的整体,但在实际中很难做到使符合这一定义的一切个体均能有机会被选入样本,例如在本例中西藏游牧区妇女,在部队服役、劳教、患病特别是患精神病的妇女等,虽然在理论上符合研究总体的定义,但实际上无法对其调查。实际上,样本是从调查总体而不是从研究总体中抽取的。调查总体是研究者从中实际抽取调查样本的个体的集合体,它往往是对研究总体的进一步界定,即对时间、范围做更进一步规定,例如本例中的调查总体可界定为:1988年7月1日零时(除中国台湾和西藏外)28个省市自治区15—49岁妇女,并且要将住在医院、精神病院、监狱、劳教所、军队中的妇女除外。一般地说,样本只能推论调查总体而不是研究总体。
3.抽样框,又称抽样范畴,是从中抽取样本的抽样单位名单。在一次抽样中,抽样框的数目是与抽样单位的层次相对应的,上面例子中有三个层次的抽样单位:乡、村、家庭,则对应的抽样框亦应有三个:全部乡的名单、乡样本中所有村组成的名单、村样本中所有家庭的名单。
4.参数值与统计值。参数值是关于总体中某一变量的综合描述,例如全国妇女平均受教育年限,就是一个参数值。统计值则是关于调查样本中某一变量的综合描述,例如从一个样本中得到的妇女平均受教育年限。抽样调查的重要内容之一就是通过样本的统计值推算总体的参数值,从而达到由部分认识总体的目的。
5.抽样误差。由前所述,总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会有偏差,这种偏差就是抽样误差。它是样本代表性大小的一个标准。需要指出的是,抽样中因误抄、计算错误等人为过失和其他一些因违反随机原则而产生的误差并不是这里所说的抽样误差。
6.置信水平与置信区间。置信水平是指总体参数值落在样本统计值某一正负区间内的概率,而置信区间是指在某一置信水平下,样本统计值与总体参数值的误差范围,详细内容参见第十五章的讨论。
二、抽样的基本程序
1.界定研究总体和调查总体。对研究总体的界定过程也就是对它的基本构成单位,所包含的内容以及空间与时间的范围等作出规定的过程,同时它也是确定调查对象,即它的内涵、外延及数量的过程。这种界定要与研究目标及要求相符合,并且要具有理论依据。例如前面提到过妇女生育力的研究,其研究总体被界定为“15—49岁的妇女”,因为理论上认为这一年龄段的妇女具有生育能力。在一些情况下,研究总体就是实施调查的总体,这时研究总体与调查总体一致,但在另外一些情况下,研究总体不等于调查总体,后者只是它的一部分,在这种情况下,调查总体的结论是否适用于研究总体要进行必要的讨论,否则会导致错误的结果。1936年美国《文学摘要》所进行的总统选举的民意测验的失败就是这种错误的一个著名的例子。
有些调查,也许理论上可以对研究总体作出界定,例如借助广播、电视、杂志或报纸进行的调查,理论上其听众和读者就是研究总体,但是由于不知道这个总体的范围,因此从中选取的不是随机样本,加上往往不了解这个总体的特性,因而不可能确定样本的质量,即样本是否代表了总体,如果这时推论总体,就会发生错误。
由上所述可以看出,为了组织有根据的抽样研究,必须根据研究对象的社会学性质界定研究总体与调查总体,并掌握有关总体的社会情况。在实际中如何选择研究与调查总体以及用何种标准去选择呢?一般应从理论与实践两个方面考虑。理论上要考虑的是:(1)典型性,例如选择一典型企业进行组织研究;(2)与某一理论相一致(选择时要首先考虑它有可能证实理论); (3)反驳或修改一种理论(选择时首先考虑它有可能是“偏差”理论); (4)选择过去曾作过研究的研究或调查总体(重复实验、估价变化与反应); (5)选择过去未研究过的总体(希望发现新理论)。实践的考虑是:(1)方便性(例如选择家乡); (2)易于得到资料(例如在研究中官方记录可用); (3)考虑应用性;(4)合作的需要或同意做研究(例如在监狱中的研究)。
在确定了调查总体和抽样单位后,就要编制抽样框,即将总体按抽样单位划分为各部分,这些部分必须互不重叠且能合成总体,然后毫无遗漏地编号排列成表,每个抽样单位唯一地与表上的一个号码相对应。对于不同类型的总体,抽样框的形式也有多种。在学校、企业、机关等正规社会组织中进行抽样时,可以利用现成的人员花名册;而在某一个地理区域内抽样时,常可使用人口普查资料编制抽样框。抽样框是概率抽样一个最基本的要求,它的质量关系着抽样的质量。在实际抽样时,得到一个好的抽样框往往既困难又麻烦,需要具备一定的技巧并采取认真细致的态度。例如当总体范围太大时,如果没有现成的抽样框,就需要编制一个新的抽样框,这往往要花费巨大的人力、物力,如编制一份北京市全体60岁以上老人的清单。有时可能会有一现成的抽样框,但它们可能已经过时,例如1983年人口普查时已得到一份北京市60岁以上老人的清单,但1989年调查时由于一部分人新进入这一总体,一部分人已死亡,这份清单已经过时,这时应把清单进行整理或稍微修改总体定义。此外,在复杂的多阶段抽样中,相应各个阶段要有多个抽样框。
2.设计和抽取样本。设计包括两部分,一是确定样本所含个体的数目,二是选择抽样的具体方法。样本所含个体数目的多少与抽样方法均对样本代表性有重大影响。本章我们专辟两节讨论这两个问题。样本大小和抽样方法确定后,便实际进行抽样。
3.评估样本与对总体进行估计。抽样的目的不是说明样本本身的情况,而是通过样本推断和说明总体。因此,样本对于总体的代表性问题始终是抽样中关注的中心问题。衡量样本质量主要有两个标准,即准确性和精确性。
准确性 所谓样本准确性是指样本没有偏差。偏差也称系统误差,它可能来源于多种原因,其中主要有:(1)抽样程序的缺点,即未能严格遵循随机原则。例如所使用的抽样框不完整或已过时;或抽取样本时掺入了主观判断因素等。(2)无回答,无回答是样本偏差的主要来源之一。一个样本一经抽定,就应严格按选定的调查对象进行调查。但在实际调查中,有时在调查现场找不到被选定的人,或调查对象拒绝调查或对某些问题拒绝回答。这些无回答者往往具有某种特征,例如关于家庭收支调查,那些高收入者往往拒绝回答收入情况的问题;又如在外面做工的人往往无法调查到。这就使实际调查的样本与被抽出的样本产生偏差。事实上一个包含比初始选定的单位少于80%的样本几乎肯定地是有偏差的,在这种情况下应通过二访、三访或其他手段提高回答率。
精确性 样本精确性是指抽样误差的大小。如前面所述,抽样误差是抽样这种方法所固有的误差,是随机误差。抽样误差可以定量进行估计,因此研究人员对于抽样误差的估计具有很大的主动性。
从理论上讲,如果能严格遵照随机原则和抽样程序,并提高回答率与问卷回收率,就可以得到一个无偏即准确性很高的样本,但实际上是很难做到完全无偏的,而且没有确定的数学模型从资料内部对样本的偏差进行测量,这给我们对样本代表性的评估带来了很大困难。但是由于有技术和有经验的抽样专家可以最大限度地减少偏差,因此可以假设这种情况下抽取的样本是无偏的,这时就可以用抽样误差对样本进行评估。
对样本的评估分为两个阶段,即正式调查前和调查结束后,后者是计算抽样误差并由样本统计值推论总体参数值等。本节我们主要介绍前一阶段的样本评估方法,调查后的样本评估和对总体的估计将在“统计分析”一章详细介绍。
在依确定了的样本规模和抽样方法抽出样本后,应先对抽出的样本进行评估,其目的是初步检查样本对于总体的代表性,以剔除那些偏差太大的样本,重新抽样。评估可以采取收集若干容易得到的资料,例如年龄、性别、文化程度等作为样本与总体之间的比较的方法。下面举例加以说明。比如我们要抽样调查某一小镇上的家庭平均人口和每月平均消费水平。已经从全镇1000户家庭中抽取了100户作样本。这时可在正式调查之前先收集一些容易取得的资料,例如全镇人口的性别比率为107,而抽取的100户中人口性别比率为105;又如从其他报表上得知全镇家庭中有28%大户(3人以上),56%小户(2人与3人户), 16%为单身户。而在抽出的100户中相应家庭的比例为25%、60%、15%。由上述总体与样本之间人口性别比例与家庭结构比例的比较中,我们就可以看到所抽样本与总体情况相似。这样的样本就有代表性,能在平均人口与消费量的调查推论中获得可靠结论。如果两者资料相差甚多,则表明前面的步骤中有问题要检查、修正。一般地说,比较的变量越多,样本越可靠。
样本评估目前在规范化的社会调查研究报告中已成为一项不可缺少的指标。