第一节 抽样与抽样调查
抽样是一种选择调查对象的程序和方法。一般来说,对于由千差万异的个体所组成的总体,如果能对总体作全面的、普遍的调查,即将研究对象的整体无一例外地全部作为调查对象,其所得结果应该说是最具普遍意义、最能反映总体特征的。但是在很多情况下,实施这种整体调查非常困难,因此常常代之以抽样调查。所谓抽样调查,就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。这种从总体中选出一部分的过程就是抽样,所选出的这部分代表称为样本。选取样本的方法一般分为两大类,一类是根据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择;与此相反,另一类是依据概率理论,按照随机的原则选择样本,完全不带调查者的主观色彩。前者称为非概率抽样,后者称为概率抽样。抽样调查一般是指采用概率抽样的调查。但在社会研究中,人们也常常把采用非概率抽样的大样本调查包括在内。
抽样作为一种从部分到总体、从个别到一般的认识方法,自古以来一直被人们自觉或不自觉地使用着。例如医生通过抽取病人全身血液中的一小部分,化验出全部血液的情况。母亲喂婴儿水时,通过尝一口来判断整瓶水的温度等。但抽样作为一种科学的调查方法却只有很短的历史,它是在近代数理统计理论迅速发展的基础上形成的一种调查方法。
社会科学中的抽样调查,始于1891年挪威的人口调查。而社会学中最早采用抽样方法的调查,是鲍利(A.L.Bowley)于第一次世界大战前在英格兰和威尔士所做的五城镇调查。此后,特别是二次大战后,随着电子计算机技术的迅速发展,抽样调查法得到迅速推广,它被越来越广泛地应用于社会的各个领域,目前它已成为社会调查的主流。与整体调查(普查)相比,抽样调查具有下列优越性:
第一,调查费用较低。当总体包含的研究对象数目较大时,普查所需费用甚巨。例如我国第三次人口普查,动用普查工作人员710多万,正式普查期间还动员了1000多万干部群众参加,花费人民币约4亿元。而抽样调查由于调查的仅仅是整体中的一部分,因此,所需费用较整体调查要少得多,特别是当研究对象的数目相当大时,只从中抽取一小部分就可保证足够的精确度,因而节省的经费相当可观。
第二,速度快。显然,调查全部研究对象比调查它的一部分要费时得多。而时间往往是重要的,特别是某些社会现象需要及时了解,随时掌握。在迅速提供有关信息和掌握变动的社会现象方面,抽样调查具有很大的优越性。
第三,应用范围广。由于上述两个特点,抽样调查可广泛用于各个领域,各种课题,而不像普查那样只限于统计部门或政府部门。此外,在某些种类的调查中,必须使用受过高度训练的人员或专用设备,在这类人员和设备有限、难以进行普查的情况下,只能通过抽样调查来获取信息。因此,就取得信息的种类来说,抽样调查可以发挥作用的范围更广,且更灵活。1986年中国残疾人调查,即为一例。这种调查需要医疗卫生工作人员和医疗器械,若进行普查,在目前情况下根本无法进行。
第四,可获得内容丰富的资料。为了节约费用,减少工作量,以及适合各地区的情况,普查通常只了解少量项目,而且多是一些行政上的基本资料,很少有关于态度、意见方面的内容,无法进行深入分析。例如人口普查,我国1953年的第一次人口普查,只有姓名、与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目虽有所增加,但也只有19个。而抽样调查因调查对象的数目较普查为少,因此可以设置数量较多和较复杂的调查项目,并能集中时间和精力作详细的分析。
第五,准确度高。整体调查需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。抽样调查则可以使用少量素质较高的工作人员并对他们进行充分的训练,还可以在实地调查中给予更仔细的检查监督,调查资料的处理亦能较好完成,因此与整体调查相比,抽样调查的资料往往更准确、更可靠。
因此,在大规模的社会调查中常采用抽样调查,特别是在下述几种情况下:(1)当事实上不可能进行或不必要进行普查时。(2)当对具体调查的统计资料的正确性进行检查与核对时,例如对于全国人口普查的统计资料可靠性进行检查和评估。(3)当需要对问题进行更全面、精密、深刻的研究时。
不难看出,抽样调查优于整体调查之处主要在于,前者的调查对象数目远较后者为少,它只是整体的一小部分,研究者通过这一小部分的调查研究,经济、迅速、准确、深入、广泛地认识总体的特性。但是,这些优越性的成立,必须依据下述假设:(1)部分是含于整体之中的;(2)更重要的是,部分与整体有同样的特征、现象、关系及过程;(3)部分能够为研究者提供一个有关群体生活、群体态度、价值和意见的更为清晰的脉络。如果没有这样的假设前提,那么,即使抽样调查具有省钱、省力、速度快、应用广、准确性高、资料信息丰富等优越性,但由于无法由其获得总体的状况,认识和了解总体的特性,也无法获得像目前这样的发展,成为社会调查的主流。
然而,并非任何部分都能够反映总体,例如当我们考察一个社区居民的收入水平时,如果选取的都是收入高的居民进行调查,那么这样的“一部分”的收入当然无法代表总体的收入状况。由此可见,抽样调查的成功首先要求所选取的样本能够代表总体。所谓代表,就是说,所选取的样本从调查要研究的总体特征来看,能再现总体的结构。当然,如果一个总体中的所有个体在一切方面都相同的话,那么从中任意选取一个个体就能代表总体,也就没有必要抽样了。但社会研究的对象中不存在这种同质总体,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。这也就是说,在用样本来概括总体时总要有误差,它的大小可以反映出样本代表性的高低。对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小,并依据我们所要求的代表性,抽取出相应的样本。因此,抽样调查的关键在于:(1)“如何判断一个样本的误差大小?”不解决这个问题,我们就无法保证样本推论总体的可信性。(2)“怎样才能抽到一个有代表性的样本?”如果我们无法从理论上和技术上实际抽选出一个达到我们所要求的代表性的样本,那么用样本概化总体便毫无意义。直到20世纪,由于数理统计学中的抽样理论的建立才使这两个问题获得了有效解决。这一理论指出,遵循随机原则的概率抽样可以保证抽选出有一定代表性的样本,并能够通过计算估计样本与总体间误差的大小以及这种估计的可信程度。这就给抽样法奠定了科学的基础,从而使抽样调查成为宏观社会研究的主要方法之一。
宏观社会研究的范围有时是一个城市、一个国家,甚至整个世界。对于这种大范围的社会学研究,一方面我们因缺乏全面调查的财力、物力而难以实施,另一方面,由于认识能力的限制,人们难于直接把握这样大范围的复杂的社会现象的本质,难以在宏观层次对制约现象各类因素之间的内在联系,相互影响以及现象产生的原因进行有效分析。由于抽样调查能够得到较好地再现总体结构的样本,因此它可以将一个宏观的社会研究缩小成微观的社会研究,这就使得我们能较容易地把握现象本质以及各类因素之间的内在联系,并形成有关的假设和理论。此外,对各种社会理论或假说,也可以通过抽样调查加以验证,这就使它成为理论检验研究的有力工具。