项目1 抽样
【学习目标】
1.掌握抽样方法及基本原则。
2.能按要求对纺织品进行抽样。
一、抽样检验
抽样检验,简称“抽检”,是按统计的方法要求,用适当的抽样方法从母体中抽取适当的样本进行检查或测定,将检验结果与检验标准相比较,利用统计方法判定该群体是否合格。
1.统计推断 在收集数据时,通常不太可能为了掌握一批产品的质量信息而对整批产品全部进行检验,尤其是需要进行破坏性检验的时候或产品数量巨大的时候。一般的方法是采用统计推断的方式,即采用在全部产品中采取随机抽样的方式,选取一定的样品来进行测试,将样品测试的结果组成样本数据,然后通过对样品数据的分析来推断整批(全部)产品的质量。
在统计推断中,涉及一些名词如总体、样本等,分别简述如下。
(1)总体。总体也称为“母体”,是研究对象的全体。如一批零件、一个工序或某段时间内生产的同类产品的全部都可以称为总体。
(2)个体。构成总体的基本单位,称为个体。如每个零件、每件产品都是一个个体。
(3)总体容量。总体中所包含的个体数量称为总体容量,通常用N来表示。如一批零件、一个工序或某段时间内生产的同类产品的总数量。
(4)样本。样本又称子样,是从总体中抽出来一部分个体的集合。
一般我们用X1,X2,…,Xn来表示总体的一个样本。
样本中每个个体称为样品,样本中所包含样品数目称为样本大小,也叫样本量,常用n表示。
对样本的质量特性进行测定,所得的数据称为样本值。
样本数据的取值记为X1,X2,…,Xn,称为样本观测值。
当样本个数越多时,分析结果越接近总体值,样本对总体的代表性就越好。
对于纺织品的各种检验,实际上只能限于全部产品中的极小一部分。一般情况下,被测对象的总体总是比较大的,且大多数是破坏性的,不可能对它的全部进行检验。因此,通常都是从被测对象总体中抽取子样进行检验。
总体、样本、数据间的关系如图2-1所示。
图2-1 总体、样本、数据间的关系
2.取样数量 为了控制和消除仪器误差,试样量的大小(样本容量)在大多数情况下是根据数理统计方法确定的。最常用的确定取样数量的统计方法可分为有限总体和无限总体两种。
(1)有限总体的样本容量。有限总体的数量是有限的,如从N包纤维中抽取n包检验,可由式(2-1)求得:
式中:n——取样数量;
t——取决于要求概率水平的系数,可查t值表(表2-1)得到;
CV——变异系数;
Δ——允许误差;
E——保证误差率;
N——有限总体的个数。
表2-1 t值表
(2)无限总体的样本容量。对某些纺织品的性能进行检测(如纤维、纱线的强力)时,检测数量n'远小于总体数量,可认为总体是无限的,即N→∞,则:
当CV值未知时,可先指定一个试验次数n,根据这n次试验结果求出CV值,再代入公式求出n'。若n'<n,则认可原设定的n,否则需要补做(n'-n)次试验。
一般试验取E=±3%,样品性质离散性大的项目,如强力试验取E=±4%或±5%。置信概率水平一般取95%(即显著性水平α=5%),要求高时用99%(α=1%),要求低时用90%(α=10%)。
二、抽样方法
子样检验的结果能在多大程度上代表被测对象总体的特征,取决于子样试样量的大小和抽样方法。在纺织产品中,总体内单位产品之间或多或少总存在质量差异,试样量越大,即试样中所含个体数量越多,所测结果越接近总体的结果(真值)。试样量的大小,可以用统计方法来确定。要保证试样对总体的代表性就要采用合理的抽样方法,即要尽量避免抽样的系统误差,既排除倾向性抽样,又要尽量减小随机误差。为此,应采用随机抽样方法。
1.随机抽样 随机抽样是指从总体中随机抽取一定数目的个体单位作为样本进行观察,使每个个体单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。随机抽样能有效地避免主观性导致的倾向性误差(系统误差),使得样本资料能够用来有效地估计和推断总体的数量特征,并通过计算抽样误差,说明估计结果的可靠程度。
2.随机抽样的方法 随机抽样的方法有很多,常用随机抽样方法如图2-2所示。
(1)简单随机抽样。简单随机抽样也称为单纯随机抽样、纯随机抽样、SRS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
当总体容量不大时,随机抽样是一种有效的抽样方法。
简单随机抽样是最基本的抽样方法。分为重复抽样和不重复抽样。在重复抽样中,每次抽中的单位仍放回总体,样本中的单位可能不止一次被抽中。不重复抽样中,抽中的单位不再放回总体,样本中的单位只能抽中一次。
简单随机抽样的具体做法有抽签法、随机数法,分别简述如下。
①抽签法。一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
②随机数法。利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫作随机数法。
简单随机抽样方法简单直观,由于总体中每个个体抽取的概率相等,计算抽样误差及对总体参数加以推断比较方便。
但这种抽样方法的抽样顺序比较复杂,在实际工作中,真正做到总体中每个个体被抽到机会完全一样是不容易的。
(2)系统抽样。系统抽样又称机械随机抽样或等距随机抽,即将总体单位按某一标志(如时间)排序,然后按一定间隔来随机抽取样本。
如果被抽总体足够大,并且易做某种次序的整理时,用系统抽样较为合适,这种方法适用于大批量生产的流水线上产品的抽查。
系统抽样实施方便,同时能够保证样本对总体的代表性。
图2-2 抽样方法分类
但如果总体单位排序后呈现一定的规律性甚至周期性,而抽样间隔的周期正好与之吻合,系统抽样就会导致系统性的偏差。
(3)分层抽样。分层抽样是先将总体按照与研究内容密切相关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层内差异,增加样本的代表性。当获得的资料不均匀,或呈偏态分布时,分层抽样是一种有效的抽样方法,特别适用于对产品质量的验收。这种抽样方法误差小,但抽样手续比较烦琐。
(4)整群抽样。整群抽样也称集团抽样,即在总体中,不是抽取个别样品,而是随机抽取整群的产品。这种方法是先将总体按某个标志(企业、车间、班组、工序或一段时间内生产的一批零件)分成若干群,然后随机抽取若干群,并由抽中的所有个体组成样本。
这种方法常用于工序控制中,抽样实施比较方便。但由于抽样来自个别几个群,而不能均匀分布在总体中,因而代表性差,抽样误差大。
三、抽样检验的分类
抽样检验的分类方法很多,主要有以下几种类型。
1.按抽样检验数的数量分类
(1)全检。全数检验,简称为“全检”,是对全数物品检验的方法,又称为100%检验。它不仅耗时且耗费较高的成本,常用在机械化、自动化程度高,非常关键、较少数检验中。
全数检验一般使用于以下几种状况。
①不允许有不合格产品,任何不合格产品将造成安全上或经济上损失时。
②制品品质水准恶化,亟待修正为规定品质水准时。
③需要了解该批制品实际品质状况时。
④检验手续简单,不会大量浪费人力、时间、经费时。
⑤检验的数量较少时。
(2)抽检。抽样检验,简称为“抽检”,是按一定的产品抽样水准及抽样计划,用适当的抽样方法从母体数中抽取适当的样本数,经检验结果与原定检验标准比较,利用统计方法以判定该群体是否合格。
以下状况可使用抽样检验。
①破坏性检验。
②允许有少数不合格品。
③节省检验费用及时间。
④受验物品个数很多时。
⑤100%全检不可行时,全检影响交货期时。
⑥全检之成本远高于不合格品所造成之成本时。
⑦检验对象是散装或流程性材料时,如煤炭、矿石、钢水、整卷纸张、电线等。
(3)免检。免检,是指产品检验时对产品不予检验。理论上,免检是最经济的,可以大量节约人力、物力、财力、时间等资源,在实际工作中,在有一定保障的基础上尽可能免检。
以下状况可使用免检。
①时间非常紧急,没有时间检验。
②对于产品的不重要的特性的检验,且对产品使用没有影响,也没有风险的检验。③无法对产品的某种特性进行检验,如对于芯片的性能,一般只能免检。
④在上游供货商已做检验且被认可,如对于世界知名企业的产品可列为免检产品。
⑤在商业检测中,如果产品检测历史记录非常好,对其中某一批或某几批产品可采用免检。
2.按抽样检验次数分类
(1)单次抽样。单次抽样,就是指在抽样的过程中,只从检验批中抽取一次来检验。在商业检验中,大多数都有采用单次抽样。
(2)双次抽样。双次抽样是指在抽样的过程中,从检验产品中抽取一组样品来进行检验之后,再从中间抽一组样品来检验。这中间又有两种状况:一是第一组样品检验之后,样品不放回去;二是第一组样品检验之后,样品又放回原批中再重新抽第二组。
(3)多次抽样。多次抽样实际上是双次抽样的延续,只不过是将双次抽样的次数增多而已。
3.根据检验严格程度分类 在各种抽样计划中,为了考虑产品的品质可能有连续性和成本等要求,一般都会设立三种不同严格程度的检验。
(1)正常检验。正常检验就是在抽样计划中,在正常状况下使用的检验。
(2)加严检验。加严检验就是比正常检验的数量更多,如原来要抽100个,加严检验要抽125个。
(3)放宽检验。放宽检验就是比正常检验的数量更少,如原来要抽100个,放宽检验却只要检验70个。
4.按检验对象的属性分类
(1)计数抽样检验。根据给定的技术标准,将单位产品简单地分成合格品或不合格品的检验;或是统计出单位产品中不合格数,进而推断整批产品的接收与否的检验。前一种检验又称“计件抽样检验”;后一种检验又称“计点抽样检验”。
计数抽样检验适用于下列检验:
①连续批产品。
②原材料、外购、外协件,成品、半成品交接。
③库存品复检。
④无形的产品(服务、旅游等),工序管理和维修操作。
⑤一定条件下的孤立批。
(2)计量抽样检验。根据给定的技术标准,将单位产品的质量特性(如长度、重量等)用连续尺度测量出具体数值并与标准对比的检验,进而推断整批产品的接收与否的检验。
与计数抽样相比,计量抽样的特点有以下几点。
①计量抽样检验的数据比计数抽样检验的数据更精确地反映产品质量。
②计量抽样检验虽然所需样本量较少,但检验程序复杂,且单位产品检验费用更高,更耗时。
③当检验费用昂贵时,如对价值较高的产品进行破坏性检验时,计量抽样检验具有优势。
④计量抽样检验必须针对每一个特性制订一个抽样计划,随着产品测量项目的增多,计量抽样计划的实施变得更为复杂。
由于计量抽样检验方案的设计是基于质量特性值服从正态分布的,所以计量抽样检验只适用于质量特性的测量值服从正态分布的情形。
四、质量数据统计特征的描述
抽样的目的是通过样本来反映总体特征。在质量管理中,常常将测试的样本数据,通过整理加工,找出它们的特性,从而推断总体的变化规律、趋势和性质。例如,可以用中心倾向及数据的分散程度来表示数据的分布情况,表示中心倾向的有平均值、中位值等,表示数据分散程度的有方差、标准偏差、极差等。
1.表示样本集中程度的特征量
(1)样本平均值。表示n个样本测定值为Χ1,Χ2,…,Χn,则样本平均值为样本中的多数数据分布在样本均值附近,因此,样本均值表示了样本数据的“质量中心”,是数据高低相抵、误差正负相抵后客观事物必然性数量特征的一种反映。
在数学上,均值有两个非常重要的数学性质。
①各个样本数据与均值的离差之和为零。
②各个样本数据与均值的离差平方和最小。
(2)样本中位数。当样本数据中存在极端数据时(个别数据特别大或者特别小),样本均值不适合作为数据集中趋势的代表,而应以样本中位数来表示数据的集中程度。样本中位数是将样本数据从小到大排列后处在中间位置上的数据。当样本容量n为奇数时,它恰为中间的一个数;当样本容量n为偶数时它是中间两个数据的平均值。
若记排序后的样本测定值为x1≤x2≤…≤xn,则
在实际应用中,要根据不同的研究目的和不同的数据分布特征来选择均值或中位数作为集中趋势的代表值。
一般来说,当数据呈现对称分布或近似对称分布时,均值与中位数是一致的,此时应选择均值作为数据集中趋势的代表值。
但当数据分布的偏斜度较大(出现极端值情况)时,均值容易受到极端数据的影响,不能很好地反映样本数据的集中趋势,此时应选择中位数作为集中趋势的代表值。
(3)众数。在一批数据中,出现次数最多的那个数称为众数,记作M0。
例如,某厂先后对本厂的某型号的一批产品的不合格数进行统计,得到如下表(表2-2)所示的数据。
表2-2 众数
观察表2-2,出现3个不合格品的次数最多,共有48次。故众数M0=3。
2.表示样本数据离散程度的特征数 表示样本数据离散程度的特征数有极差、方差、标准差。
(1)极差。极差能正确反映数据的范围,记为R。
若记排序后的样本测定值为x1≤x2≤…≤xn,则
(2)方差。当样本容量增大时,数据中出现最大或最小异常值的可能性也随之增大,这时用样本极差表示数据的波动程度的可靠性随之下降。为了充分利用样本数据,常用样本方差来表示数据的波动。
方差是样本数据集中所有观测值的离差平方和的“平均值”,记为S2。
(3)标准差。由于样本方差的纲量与原始数据的纲量不同,方差纲量是原始纲量的平方,所以在实际的应用中,常用方差的算术平方根来表示数据的波动程度,称为样本标准差,记为S。
3.收集质量数据的注意事项 收集质量数据时应注意以下几个方面的问题。
(1)明确收集数据目的与方法。
(2)注意数据的修正,剔除异常数据。
(3)数据记录要真实、可靠、准确。
(4)测定和记录工作应标准规范。
(5)注意记录与数据有关的数据背景,如测试时间、地点、数量、测试者、批号、名称、规格及必要的环境条件等,这样有利于分析问题,且可以避免不同条件的数据混淆。
4.质量变异及统计特征描述 质量变异是指同一批量的产品,即使所采用的原材料、生产工艺和操作方法都相同,但各产品的质量也不会完全相同,它们之间或多或少会有些差别,这种差别被称为质量变异。
承认质量变异,通过找出其变异过程中的统计规律性来控制产品质量,是现代质量管理学和传统质量管理学的重要差别。
(1)产品质量的变异性。由于在生产的过程中,工艺条件总是存在一定的变化,因此产品的质量在产品生产过程中不停地变化着,这就是产品的变异性,也称为质量的波动性。
(2)产品质量变异的统计规律性。产品质量变异具有统计规律性。在生产正常的情况下,通过对产品质量变异大量调查与分析后,可以用概率论与数理统计的方法来精确地找出产品质量变异的幅度,以及不同大小的变异幅度出现的可能性,即找出产品质量的分布规律,这就是产品质量变异的统计规律。
在质量管理中,计量质量特性值常见的分布有正态分布等,计件质量特征值常见的分布有二项分布等,计点质量特征值常见的分布有泊松分布等。
掌握了这些统计规律的特点与性质,就可以用来控制与改进产品的质量。
(3)质量因素的分类。把影响质量的因素,称为质量因素。根据不同的划分标准,质量因素可以分类如下:
①按不同的来源分类。按不同来源可分为操作人员、设备、原材料、操作方法、环境、测量等。
②按影响大小与作用性质分类。
a.偶然因素,又称为随机因素。偶然因素具有如下特点:影响微小,对产品质量影响微小;始终存在,只要存在生产,这些因素就一定存在;逐件不同,由于偶然因素是随机变化的,所以每件产品受到偶然因素的影响是不同的;难以除去,指偶然因素是在技术上有困难或在经济上不允许消除的。
随着科技的进步,有些偶然因素可以逐步得到减少和消除,但是不可能完全消除所有的偶然因素,因此偶然因素引起的质量波动是不可避免的,同时也是影响微小的。
对于偶然因素,可以忽略,不必特别处理。
b.异常因素,又称为系统因素。异常因素有如下特点:影响较大,即对产品质量影响较大;有时存在,它是由某种原因所产生的,不是在生产过程中始终存在的;一系列产品受到同一方向的影响,指加工件质量指标受到的影响是都变大或都变小;不难除去,指这类因素在技术上不难识别和消除,而在经济成本上往往是允许消除的。
异常因素对产品的质量影响较大,可造成产品质量过大的异常波动,以致产品质量不合格,同时它也不难加以消除。
在生产过程中异常因素是应该注意的对象。一旦发现产品质量有异常波动,就应尽快找
出其异常因素,加以排除,并采取措施使之不再出现。