纺织品外贸检测实务
上QQ阅读APP看书,第一时间看更新

项目4 数据处理

【学习目标】

1.会对测试结果进行分析计算。

2.会对测试数据进行修约。

3.能对测试结果进行误差分析、异常值处理等。

所谓数据处理是指从获得的数据得出结果的加工过程,包括记录、整理、计算、分析等处理方法。数据处理过程中要进行测量误差处理、数据修约等。恰当地处理测量所得的数据,可以最大限度地减少测量误差的影响,得到一个尽可能精确的结果。

一、测量误差

在测量过程中,由于测量器具本身的误差以及测量方法、测量环境等因素制约,导致测得值与被测真值之间存在一定的差异,这种差异称为测量误差。

依据JJF 1001—1998《通用计量术语及定义》,测量误差的定义是“测量结果减去被测量真值”,实际工作中,测量误差又简称误差。

1.误差的分类 测量误差按其产生的原因可分为系统误差、随机误差、过失误差。

(1)系统误差。由于测量工具(或测量仪器)本身固有误差、测量原理或测量方法本身理论的缺陷、实验操作及实验人员本身心理生理条件的制约而带来的测量误差称为系统误差。

系统误差的特点是在相同测量条件下,重复测量所得测量结果总是偏大或偏小,且误差数值一定或按一定规律变化。减小系统误差的方法通常可以改变测量工具或测量方法,还可以对测量结果考虑修正值。

引起系统误差的原因很多,主要有以下几种。

①检测原理或检测方法不完善而产生的误差。

②由仪器设备而引起的误差。

③由环境条件所引起的误差,如环境温湿度不稳定、气压变化、振动、噪声等诸多因素的影响。

④由操作人员而引起的误差。

系统误差决定了检测的准确度,系统误差越小,检测结果的准确度越高。

(2)随机误差。随机误差是测量结果与在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值之差。随机误差又称偶然误差,是随机产生的。它是在对同一产品的检测过程中,由于操作人员技术不熟练、外界条件的变动、检测仪器的不完善、检测对象本身的状态发生变化等偶然因素的影响而引起的误差。

从随机误差分布规律可知,增加测量次数,并按统计理论对测量结果进行处理可以减小随机误差。

随机误差决定了检测的精密度,随机误差越小,检测结果的精密度越高。

(3)过失误差。过失误差也称疏失误差、粗大误差。是由于测量过程中的错误、疏忽等原因引起的误差,如读错、记错或操作仪器错误,或偶然一个外界干扰因素造成的等。过失误差是指一种显然偏离实际值的误差,没有任何规律可循,纯属偶然引起。如发现检测结果中存在过失误差,必须从检测结果中剔除。

2.误差的表示 测量误差可用绝对误差和相对误差两种指标表示。

(1)绝对误差。绝对误差是测定值X与真值(被测参数的理论值叫作真值)μ0之间的差值。用ΔX表示绝对误差,则:

事实上,真值是不知道的。但可以通过量具或高一级准确度的仪器进行校核等方法来预先掌握仪器的测量误差ΔX,再由测量值X估计真值μ0的所在区间。即:

可见,只有在仪器的误差或校正值的范围已知的情况下,检测结果才有意义。

在实际检测中,当没有显著的系统误差时,只要检测的次数足够,根据数理统计理论,就可用所测数据(测定值)的算术平均值代表其真值。

(2)相对误差。相对误差是绝对误差ΔX与真值μ0的比值,用δ表示相对误差,则:

实际计算时,可以近似地用测定值X代替分母中的真值μ0,δ越大,测定值X偏离真值越远。检测的准确度就越差。

相对于绝对误差而言,相对误差更能反映检测结果的准确性。

3.误差的来源

(1)仪器误差。仪器误差是仪器设计所依据的理论不完善,或假设条件与实际检测情况不一致(方法误差)以及由于仪器结构不完善、仪器校正与安装不良(工具误差)所造成的误差。

在仪器上可能出现的误差主要有以下几种。

①零值误差。仪器零点未调整好,检测结果的绝对误差为一常数。

②校准误差。仪器刻度未校准,指示结果系统偏大或偏小,相对误差为一常数。

③非线性误差。仪器输入量与输出量之间不符合线性转换关系。

④迟滞误差。仪器输入量由小到大或由大到小,在同一检测点出现输出量的差异,或是仪器进程示值与回程示值之间的差异(进回程差)。

⑤示值变动性。对同一被测对象进行多次重复检测,检测结果的不一致性。

⑥温差和时差。温差指仪器在不同温度条件下,仪器性能的变化。时差是指仪器在相同检测条件下,仪器性能随时间的变化。

(2)环境条件误差。由于各种环境因素与要求的环境状态不一致而引起的测量装置与被测量物本身的变化所形成的误差。

(3)人员操作误差。由于测量者主观原因引起的误差。如读数视差或因工作疲劳引起的视觉生理变化导致的误差等。

(4)方法误差。由于测量方法或计算方法不完善而形成的误差,如操作或试验方法不合格引起的误差。

(5)试样误差。纺织材料被测对象总体很大,要检测出全部总体性质的真值是不可能的。由于总体中个体性质的离散性、取样方法不当、取样代表性不够和检测个体数不足等,都会产生试样误差。

试样误差是除仪器误差外,另外一个影响检测结果准确性的重要因素,它取决于试样量大小和抽样方法。

4.误差的估计

按照绝对误差ΔX的定义:

式中:——多次检测的平均值;

s——平均值与真值之间的偏差,即系统误差;

r——检测值围绕平均值的波动(离散),即随机误差。也就是说,绝对误差是由系统误差和随机误差两部分组成的。这是误差的直接表示方法,当然也可以间接表示和估计误差。

二、异常值处理

在试验结果数据中,有时会发现个别数据比其他数据明显过大或过小,这种数据称为异常值。

1.形成异常值的原因 产生异常值的原因是多方面的,大致归纳为以下两方面。

(1)测量人员的主观原因。由于测量者工作责任感不强,工作过于疲劳或者缺乏经验操作不当,或在测量时不小心、不耐心、不仔细等,从而造成错误的读数或错误的记录,这是产生异常值的主要原因。

(2)外界条件的客观原因。由于测量条件意外地改变,如机械冲击、外界振动等,引起仪器示值或被测对象位置的改变而产生异常。

2.异常值处理方法 异常值的处理应按国家标准GB 4883—2008《数据的统计处理和解释、正态样本异常值的判断和处理》、GB/T 6379.2—2004《测量方法与结果的准确度 第2部分:确定标准测量方法重复性与再现性的基本方法》等来进行,一般有以下几种处理方式。

(1)异常值保留在样本中,参加其后的数据分析。

(2)剔除异常值,即把异常值从样本中排除。

(3)剔除异常值,并追加适宜的测试值计入。

(4)找到实际原因后修正异常值。

判断异常值首先应从技术上寻找原因,如技术条件、观测、运算是否有误,试样有否异常,如确信是不正常原因造成的应舍弃或修正,否则可以用统计方法判断,对于检出的高度异常值应舍弃,一般检出异常值可根据问题的性质决定取舍。

三、数字修约

在进行实际检验时,往往要对一些数据进行修约。数字修约及有效位数的保留,应按国家标准GB/T 8170—2008《数值修约规则与极限数值的表示和判定》进行。

1.数据分类 质量数据就其本身的特性来说,可以分为计量值数据和计数值数据。

(1)计量值数据。计量值数据是可以连续取值的数据,表现形式是连续型的。如长度、厚度、直径、强度等质量特征,一般都是可以用检测工具或仪器等测量(或试验)的,类似这些质量特征的测量数据,一般都带有小数,如长度为1.15m、1.18m等。在工程质量检验中得出的原始检验数据大部分是计量值数据。

(2)计数值数据。有些反映质量状况的数据是不能用测量器具来度量的。为了反映或描述属于这种类型内容的质量状况,又必须用数据来表示时,便采用计数的办法,即用1、2、3……连续地数出个数或次数,凡属于这样性质的数据即为计数值数据。

2.数据的修约条件 数据获得后,还涉及数据的定位问题,也就是对规定精确程度范围之外的数字如何取舍的问题。

(1)修约间隔。修约间隔是确定修约保留位数的一种方式。修约间隔的数值一经确定,修约值即为该数值的整数倍。主要有0.1单位修约、0.2单位修约、0.5单位修约、1单位修约等。

例如,指定修约间隔为0.1,修约值即应在0.1的整数倍中选取,相当于将数值修约到一位小数。

(2)有效位数。对没有小数位且以若干个零结尾的数值,从非零数字最左一位向右数得到的位数减去无效零(即仅为定位用的零)的个数;对其他十进位数,从非零数字最左一位向右数而得到的位数,就是有效位数。例如,12.490为五位有效位数;10.00为四位有效位数。

3.数字修约规则 GB/T 8170—2008《数值修约规则与极限数值的表示和判定》中,“数值修约”表述为“数值修约是通过省略原数值的最后若干位数字,调整所保留的末位数字。使最后所得到的值最接近原数值的过程”。所谓“最接近原数值”的概念就是修约后的修约误差应该最小,正确的做法是保证修约误差的绝对值最小。

数字的修约(0.1单位修约)按如下规则进行。

(1)拟舍弃数字的最左一位数字小于5时,则会舍去,保留其余各位数字不变。如将12.1498修约到一位小数,得12.1。

(2)拟舍弃数字的最左一位大于5时,则进一,即保留的末位位数加1。如将1268修约到“百”位数,得1.3×102(特定场合可写为1300)。

(3)拟舍弃数字的最左一位等于5,且其右边的数字并非全部为0时,则进一,即保留数字的末位加1。如10.5002修约到个位数,得11。

(4)拟舍弃的数字的最左一位数字等于5,其后无数字或其右边的数字全部为零时,若所保留的末位数字为奇数(1,3,5,7,9)则进1,为偶数(2,4,6,8,0)则舍弃。如将0.0305修约成两位有效数,则得0.030(0.0仅为定位用,非有效数字);将31500修约成两位有效数,则得3.2×104。

(5)不允许连续修约。应根据拟舍弃数字中最左一位数字的大小,按上述规则一次修约完成。如将15.4748修约成15,而不能修约成16。

(6)数字修约规则为“四舍六入五考虑,五后非零视前位,五前为偶应舍去,五前为奇则进一,整数修约原则同,不要连续做修约”。

【复习思考题】

1.什么是随机抽样?随机抽样的方法可以分为几种?

2.检测过程中为何会出现异常值?如何处理异常值?

3.计算题。

(1)现有短纤维1000包,由历史资料得知包与包之间的重量变异系数为1%,保证误差率定为0.5%,要求置信水平(1-a)为95%,求取样包数。

(2)已知a=10%,E=4%,欲确定纱线拉伸试验的检测次数。假设先测量了30次,得到CV=17%,求还需补测多少次。

4.数字修约的基本规则是什么?

5.对如下数字进行修约。

修约到一位小数:2.236 ;3.576 ;5.549 ;6.238 ;

保留两位有效数字:2465 ;30.714 ;15.325 ;0.0325 ; 47500 ;1.25 。