第五节 样本容量的确定
样本容量又称样本大小、样本规模,指的是样本内所含个体数量的多少。样本容量的确定是抽样设计的最重要的内容之一。样本大小不仅影响其自身的代表性,而且还直接影响到调查的费用和人力的花费,太大的样本会浪费人力、财力,增加工作量,甚至难以完成;太小的样本则会减少调查的效果。因此样本大小“适当”是非常重要的,适当的样本依研究目的和总体性质而定,并且还受制于客观条件以及抽样方法等,样本容量的确定是对上述几方面综合考虑的结果。
(一)研究的精确度要求与样本容量
研究的目的往往要求通过样本得到对总体的估计,例如通过一部分妇女生育力水平估计全国妇女的生育力水平。在研究目的是由样本得到对总体的估计时,首先要依研究的目的对这种估计所允许的误差大小做出规定,即确定抽样的精确度。允许误差(精确度)等于抽样误差与概率度t的乘积,t值取决于研究所要求的置信水平,可从t分布表中查出置信水平与概率度成正比。因此当置信水平确定后,允许误差实际上就是允许抽样误差。由重复简单随机抽样的误差公式可知,抽样误差与样本大小密切相关,样本越大,越接近总体,抽样误差越小;反之,样本越小,与总体差异越大,误差越大。因此样本大小视研究所要求的精确度,即允许误差与置信水平而定,对样本的精确度要求越高,所允许的误差则越小,样本就应越大,反之亦然。下表是在1 %到7%的允许误差和两种置信水平下,简单随机抽样所需样本数。
(二)总体性质与样本容量
总体性质包括两个方面:总体规模与总体异质程度。由上面的讨论可知,抽样误差与样本大小密切相关,样本越大,越近总体,抽样误差越小,反之抽样误差越大。因此,在一定精确度要求下,总体越大者其样本要求亦应越大。但这种情况仅仅在一定程度上是正确的,当总体规模增大时,必需的样本容量并不同它保持同样的增长速度,如图7.2所示,对一组已知的条件(总体可信度、方差、误差界限等等)来说,当总体规模从1000增大到500,000或更大时,样本必需量有所增长,但当总体规模达到足够大时,样本的必需量相对于总体来说,只是受到较小影响,实际上规模在10,000以上的总体,样本必需量是相当接近的(参见图7.2)。因此,所要调查的总体规模越大,使用抽样调查越经济合算。
图7.2 不同的总体规模所需的样本数量
重复简单抽样的平均抽样误差公式表明,抽样误差还与σ2有关,σ2为总体方差,它是衡量总体内个体间差异程度的指标,因此,当精确度要求一定时,样本所需容量除受总体规模的影响外,还受总体内部异质程度的影响,总体内部异质程度越低,所需样本容量越小,相反总体内部异质程度越高,所需样本容量越大,这点是容易想象的。由此可见,为了获得“适当”的样本规模,对总体的了解是必不可少的。
根据精确度的定义和简单随机抽样的抽样误差公式,可得允许误差(抽样精确度)t·,用Δ表示精确度则。因此,当确定了精度要求和概率度后,由于总体的异质程度,即σ2是未知的,n仍无法确定,为此常采用以下办法:(1)通过以往曾进行的同类调查的资料估算σ2。(2)由专家提供有关信息,据此进行估计。(3)进行试调查,以取得必要信息来估计σ2。
(三)分析要求与样本容量
许多社会研究,其目的不只是了解总体特征,而且还想了解总体中某些部分的特征,或者想了解各种变量间的真实关系,这时如果样本过小,则某些类别的子样本就可能由于调查对象太少而无法进行分析。因此在确定样本大小时,应当估计一下在分析时样本需做哪些分类,并保证每个类别有一个能够统计分析的子样本,相关分析和其后的检验方法要求每一小类的子样本容量不得小于10。
研究所要求的分析程度不同,它需要的样本大小亦不同。例如回归分析中样本大小要依自变量的个数增减。
通常大多数调查收集不止一个项目的信息资料,当项目很多时,应对其中最重要的一些项目分别确定精度要求,然后逐项确定这些项目所需子样本的大小。这时可能各项目的子样本大小相差不多,如此便选其中容量最大的一个作为总体样本容量。但有时各子样本相差很多,这时可降低某些项目的精确度要求或取消这些项目。
(四)抽样方法与样本容量
在同样的精确度要求下,样本容量还因所选择的抽样方法不同而不同,每一种抽样方法都有自己计算样本容量的公式。因此在选定抽样方法后,需分别考察和计算这一方法所需样本数。
(五)无回答与样本容量
在调查过程中,由于调查对象未找到或拒绝访问等原因,实际上最终收集到的样本数与理论决定的样本数不同。再有,即使是全参与分析的样本,也因对其中各个问题的回答率不同而在不同项目上显示出不同的样本规模,在确定样本大小时,亦应将这些情况考虑进去。例如初步确定的样本容量是1000,但估计可能有20%的无回答,则实际调查所用的样本容量应为。
(六)经费与样本容量
最后,在样本大小按上述考虑确定后,还要看看样本规模是否与准备用于调查的现有人力、物力、财力、时间等条件相适应,有时由于上述条件的限制或抽样操作上的困难,必须缩小样本,那么,就需作出选择:是减少样本规模,但达不到所要求的精确度;还是增加调查力量,以保证样本的精确度,或是干脆放弃这次调查。
由上面的介绍可以看出,样本容量的确定要受到各种因素的制约,这些因素往往是相互对立的,例如为了提高样本的代表性,我们往往希望一个大样本,但样本越大,虽然抽样误差减小了,非抽样误差却可能大大增加,经费也要增多。又如采用多阶段整群抽样,由于样本集中,虽然可以节约大量经费,但样本的代表性则会降低,要提高样本精确度,则要增加样本容量。实际上在设计样本规模时,精度要求与费用、抽样误差与非抽样误差始终是两对难于处理的矛盾。随着抽样理论的发展和抽样调查的广泛应用,其中有些成功的经验逐渐成为样本设计的依据。例如美国的民意测验,样本数一般在1600—2000人之间,最多不超过3000人,而最重要的全国调查则在15万—20万之间。在一般的社会调查研究中,实际上并不要求很高的精确度,调查人员一般是凭经验确定样本容量的大致范围,下表给出了经验确定样本容量的大致范围,仅供参考。
经验确定样本数的范围
应当指出的是,由经验确定的样本调查,其结果不能推论总体,只能作为了解总体状况的参考。要想精确地推论总体的状况,不仅要对代表性进行检验,而且要检查抽样方法是否科学。精确的抽样调查需要抽样专家和专业研究人员的严格指导。