第四节 非概率抽样
如前所述,随机抽样能够排除调查者的主观影响,抽选出较其他抽样方法更具代表性的样本,并且能够确切地知道和控制抽样误差的大小,从而使由样本推论总体,通过对样本的分析研究达到对总体的全面认识成为可能。但是在很多情况下,这种严格的随机抽样几乎无法进行,例如调查对象的总体边界不清而无法制作抽样框。此外有些研究为了符合研究的目的,不得不按照需要从总体中抽取少数有代表性的个体作为样本。再者,为了保证随机原则,对抽样的操作过程要求严格,实施起来比较麻烦,费时费力,因此如果调查的目的仅是对问题做初步探索,获得研究的线索和提出假设,而不是由样本推论总体,采用随机抽样就不一定是必须的。在上述情况下,一般代之以非概率抽样。非概率抽样由于每个个体进入样本的概率是未知的,而且由于排除不了调查者的主观影响,因而无法说明样本是否重现了总体的结构,用这样的样本推论总体是极不可靠的。尽管如此,非概率抽样对于帮助了解总体是有益的,此外它的操作方便、省钱省力,统计上也远较概率抽样简单,而且若能对调查总体和调查对象有较好的了解,抽样也可获得相当的成功。但是特别应当指出的是,将非概率抽样的结论推论到大总体时要极其慎重,否则就容易出现以偏概全的错误。非概率抽样有下述几种类型。
一、偶遇抽样(方便抽样)
是指研究者将在一定时间、一定环境里所能遇见到或接触到的人均选入样本的方法。“街头拦人”法即为一例,即在街头路口、车站码头等处拦住过往行人进行调查。电视台、电台和报社的记者常借这种方法迅速了解公众对某些刚刚发生的重大事件的反应。
又如在有些调查研究中,调查过程对被调查的人是不愉快的和麻烦的,这时为方便起见常常是将那些自愿被调查的人作为样本。因此这种抽样又称方便抽样,即按调查者的方便任意抽取样本。
偶遇抽样的优点是方便省力,但样本的代表性差,有很大的偶然性。
二、主观抽样(判断抽样、立意抽样)
在这里,主观抽样的“主观”有两种含义,一是主观判断的意思,这时,主观抽样又称立意抽样或判断抽样,即研究者依据主观判断选取可以代表总体的个体作为样本。这种样本的代表性取决于研究者对总体的了解程度和判断能力。在无法确定总体边界,或因研究者的时间和设备有限而无法进行概率抽样时,可以用此种方法。
主观抽样的第二种含义是“有目的地”选择样本的意思,例如在问卷设计阶段,为检验问题设计是否得当,常有意地选择一些观点差异悬殊的人作为调查对象。又如,研究者专找那些偏离总体平均水平者作为调查对象,其目的是研究什么使他们发生偏离。这种含义的主观抽样的目的是探寻有意义的变量类型和范围。它适用于建立分类模型。它的作用在于发现问题、提出假设,而不在于对总体作出概括。
三、定额抽样(配额抽样)
它与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样,但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。一个访问员被分配完成某个“定额”,比如他必须访问已婚妇女30名,大学教师20名。具体访问哪个已婚妇女或哪个大学教师,则完全由访问员自己选择。这就很难保证样本的代表性,访问员很可能为省事找那些最容易找的人;或访问那些在家的人,而忽略不在家的人等。
定额样本的选择也可以基于属性或特征(变量)的组合。例如在一份2×2的图表中,如下图:
组合不同性别与婚姻状况可形成四种类型:(1)已婚男性;(2)未婚男性;(3)已婚女性;(4)未婚女性。然后按照这四种类型在总体中的比例确定各自应抽人数。
定额抽样是以代表总体为目的的,因此它必须对总体的性质有充分的了解,如不同性别、年龄、教育水平的人在总体中各占多大比例等等,然后按此比例分配应抽定额。定额抽样假定:(1)只要类型划分较细,那么同一个类型中的每一个个体都是同质的,因而无需采用随机抽样。(2)只要类型划分合理,且分配给各类的名额符合总体中各类人员的分布,那么,样本就可以准确地反映总体。这两个假定在理论上是成立的,但在实施过程中很难做到。一方面在分层时不可能同时兼顾总体的众多属性,而只能考虑其中几种,因此不可能做出很细的分类。另一方面,有关总体分布变化的最新信息并不容易得到,因而配额的合理性很难保证。这些都会影响定额抽样的样本代表性。
四、滚雪球抽样
是先从几个适合的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。当调查总体的个体信息不充分时,常采用这种方法。例如,要研究城市保姆问题,研究者一开始因缺乏信息无法抽样,这时可先通过各种办法,如家庭服务公司、街道居委会或熟人的介绍等,找到几个保姆进行调查,并让他们提供所认识的其他保姆的情况,然后再去调查这些保姆,并请他们提供自己所认识的保姆……依次类推,像滚雪球一样,由小变大。但是,用这种方法抽样最后仍有许多个体无法找到,还有些个体因某些原因被提供者故意漏掉不提,这两者都可能具有某些值得注意的性质,因而可能产生偏误。有时,我们不可能对每一步所提供的对象均实行调查,而只能实行抽样调查,在这种情况下,若要取得一个概率样本,则应在每一阶段进行一次随机抽样。若只要取得一个非概率样本即可,则可在第一阶段中使用定额抽样等方法。
五、空间抽样
是针对一个变动的总体,如游行队伍、集会等进行抽样的方法,这种总体虽然是变动的,但在空间上是有限的。空间抽样最重要的是要在同一时间对整个总体进行抽样,以防止它的组成经历太大的变化。具体的做法是同时派出若干名经过训练的调查员,排成一排均匀分布在群体的一侧,每个调查者以他面对的人为第一个调查对象。然后按一定的步数间隔穿过聚集的群体,每一间隔停顿下来时碰到的人均为调查对象。当然,还可采用其他的方式进行。