2.5 误差分析及数据处理基础
科尔索夫(Kolthoff)曾断言:“理论上,物理量的正确值是不可能得到的。”即任何测量都不可能绝对准确,误差是客观存在的。
测量的目的是通过测量获取被测量的真实值。在实际测量过程中,由于种种原因,例如,传感器本身性能不理想、测量方法不完善、受外界干扰影响及人为的疏忽等,都会造成被测参数的测量值与真实值不一致,两者不一致程度用测量误差表示。
在科学实验和工程实践中,由于客观条件不可能完美无缺,以及在测量过程中人在主观方面的各种原因,都会使测量结果与实际值不同,也即测量误差客观存在于一切科学实验与工程实践中,没有误差的测量是不存在的,这就是误差公理。
虽然误差客观存在,真值难得,但测量工作者可以根据不同的情况采取针对措施以减小误差,使测量达到一定的准确度,并采用数理统计方法对实验数据进行处理和解析,从而满足生产、科研、环境监测等各方面检测需要。
当误差超过一定限度时,测量不仅变得毫无意义,而且会给工作带来危害。因此对测量误差的控制就成为衡量测量技术水平,以至于科技水平的重要标志之一。
研究测量误差的目的,就是要根据误差产生的原因、性质以及规律,在一定的测量条件下设法减小误差,保证测得值有一定的可信度,将误差控制在允许的范围之内。
传感器获得的信息是否正确,对整个测量系统的精度影响很大。如果传感器的误差很大,它后面的测量电路和指示装置无论怎样精确,也难于得到高精度的测量结果。当然,测量电路和指示装置的精度也会不同程度地影响测量结果的精度。
以下介绍测量误差的有关概念,这些概念适合于测量仪器、测量系统和传感器。
2.5.1 误差的基本概念
为了减小误差,明确数据处理的意义,首先需要对各类误差的基本概念、性质及来源了如指掌。
误差的表示
误差(error)指测量值与真值之差。误差表示测量结果的准确度(accuracy)。准确度即测量值与真值接近的程度。测量值与真值越接近,误差越小,准确度越高。
误差常用绝对误差(absoluteerror)和相对误差(relativeerror)表示。
Δx=x-μ0 (2-43)
式中:Δx、γ——绝对误差和相对误差;
x、μ0——测量值和真值。
虽然真值是客观存在的,但是由于任何测量都存在误差,一般难以获得真值。通常可能知道的真值有三类:
(1)理论真值:如三角形内角和为180°。
(2)约定真值:如国际原子量委员会讨论修订的原子量。
(3)相对真值:一些测量中,由有经验人员采用可靠方法经过多次实验而得出的结果。
例2-1 某圆柱直径真值为10.0cm,测量结果为10.2cm,分别求出测量的绝对误差和相对误差。
解 x(cm) μ0(cm) Δx(cm) γ
10.2 10.0 0.2 2%
有人会问,既然真值不可得,题目中是如何给出圆柱直径为10.0cm的真值的呢?
真值客观存在,但是测量误差也客观存在。因此被测物理量的理论真值实际上是无法测出的,通常采用高一级量具的更精确的测量值表示真值。
2.5.2 误差的分类及来源
1.按误差的表示方法分类
(1)绝对误差。某物理量测得值x与其真值μ0的差,称为绝对误差,用Δx表示,见式(2-43)。μ0是被测物理量的理论精确值,实际上是无法测出的,因而用更精确的测量值代表真值。
(2)相对误差。绝对误差Δx与真值μ0之比,称为相对误差,用γ表示,见式(2-44)。
(3)满度(引用)相对误差。通用的仪表误差(精度)表示方法,是相对仪表满量程的一种误差,一般用百分数表示,即绝对误差与仪表满量程xn之比,称为满度相对误差,用δn表示。
其中仪表满量程是测量范围上限与测量范围下限之差。
若Δxm为仪表量程内的最大允许的绝对误差,则最大引用误差δnm定义为
国家标准规定:仪表的精度等级是根据引用误差(最大允许满度误差)来确定的。
一级标准仪表的准确度是:0.005,0.02,0.05。
二级标准仪表的准确度是:0.1,0.2,0.35,0.5。
一般工业用仪表的准确度是:0.1,0.2,0.5,1.0,1.5,2.5,5.0
若某仪表的最大引用误差满足式(2-47),则称该仪表的精度等级为a(a为国家标准规定中的仪表准确度等级)
例如,0.5级表的最大引用误差的最大值不超过±0.5。
例2-2 量程为0~100V和0~1V的电压表,在整个量程范围内最大允许绝对误差为0.5V,请问这两个电压表的精度是多少?即哪块电压表的性能更好?
解 量程为0~100V的电压表,若
量程为0~10V的电压表,若
故量程为0~100V的电压表性能好。
由式(2-47),|Δxm|≤a%xn,当示值为x时可能产生的最大相对误差为
从使用仪表的角度,只有示值刚好为仪表上限时,测量结果的准确度才等于该仪表准确度等级的百分数。在其他示值时测量结果准确度则低于仪表准确度等级的百分数。
那么选择仪表时,为什么所测值最好大于或等于仪表量程的2/3到满量程之间呢?
根据式(2-48),用仪表测量示值为x的被测量时,比值xn/x越大,测量结果的相对误差越大。因此,选用仪表时,被测量的大小越接近仪表上限越好。为了充分利用仪表的准确度,选用仪表前应对被测量有所预估,被测量的值应大于其测量上限的2/3。
(4)示值相对误差。仪表某一测量示值时的绝对误差与示值之比的百分数称为示值相对误差。它反映的是示值x的准确程度。
用量程为0~100V的电压表测量不同的电压(如1V和50V的电压)绝对误差均为±0.1V,则其示值相对误差动别为±10和±0.2。
(5)测量精度。绝对误差越小,测量值越接近真值,测量精度越高。但这一结论只适用于被测量相同的情况,而不能说明不同值的测量精度。
例2-3 某圆柱直径真值为1.0cm,测量结果为1.2cm,分别求出测量的绝对误差和相对误差。
解 x(cm) μ0(cm) Δx(cm) γ
1.2 1.0 0.2 20%
细心的读者会发现例2-3和例2-1两次测量的绝对误差Δx相等,均为0.2cm。
那么这两次测量谁的精度更高呢?单纯根据绝对误差很难判断测量精度的高低。为此,人们引入了相对误差的概念。
现在考虑相对误差,发现例2-3测量的相对误差是例2-1测量相对误差的10倍。虽然两次测量的绝对误差Δx相等,但是该绝对误差相对于被测量值的比例相差却很大。
由此可以发现相对误差的物理意义是测量单位量所产生的误差(例如,对于10m的材料的测量,结果为10.2m,则相对误差为γ=0.02=2,即每测量1m的长度产生0.02m的误差)。
例2-3和例2-1这样两次不同的测量,虽然绝对误差相同,但是由于相对误差不同,例2-1的测量准确度更高。对于不同的测量,只有相对误差才有可比性,可说明测量质量的好坏。
2.按仪表误差的使用条件分类
(1)基本误差。基本误差是指仪表在规定的标准条件下所具有的误差。例如,仪表是在电源电压(220±5)V、电网频率(50±2)Hz、环境温度(20±5)℃、湿度65±5的条件下标定的。如果这台仪表在这个条件下工作,则仪表所具有的误差为基本误差。
测量仪表的精度等级是由基本误差决定的。
(2)附加误差。附加误差是指当仪表的使用条件偏离额定条件下出现的误差。例如,温度附加误差、频率附加误差、电源电压波动附加误差等。
3.按误差的性质分类
(1)粗大误差(grosserror)。粗大误差又称过失误差(疏忽误差),用ee表示,是由于某种过失所引起的误差。数据处理时含有过失误差的数据,明显偏离测量结果。这类误差是由于测量者疏忽大意或环境条件的突然变化而引起的。
(2)系统误差(systematicerror)。系统误差用es表示,是由传感器或仪表本身性能不完善、安装或调整不当、环境条件变化、测量方法不当等比较确定的因素所引起的误差。其特点是具有规律性,不随时间变化,如果条件不变,系统误差是恒定的,它将在多次测量中重复出现。
(3)随机误差(randomerror)。随机误差又称偶然误差,用er表示,是由偶然因素引起的,其特点是难以预知,服从统计规律,可用多次测量并进行统计处理的方法予以减小或消除。
为了和多数参考书一致,下面用δ表示随机误差。
随机误差来源于环境温度、湿度的变化,仪器性能的微小波动,电压的变化等,由于上述因素无法控制,随机波动,所以随机误差时大时小、时正时负,所以又称偶然误差。所谓偶然即指其大小、正负难以预言,是偶然的。
设对某被测量进行了n次等精度、独立的测量,其结果为x1,x2,…,xn。则测量值的算术平均值为
当测量次数n趋于无穷大时,取样平均值的极限称为测量值的总体平均值,即
ax与测量真值A0之差定义为系统误差,即
es=ax-A0 (2-52)
各次测量值xi与ax之差定义为随机误差,即
δi=xi-ax(i=1,2,…,n) (2-53)
各次测量值的系统误差和随机误差之和即绝对误差,即
δi+es=(xi-ax)+(ax-A0)=xi-A0=Δxi(i=1,2,…,n) (2-54)
4.按被测量与时间的关系分类
(1)静态误差:被测量不随时间变化时产生的测量误差称为静态误差。
(2)动态误差:被测量随时间变化时产生的附加误差称为动态误差。其大小为动态测量和静态测量所得误差的差值。
5.测量仪表的误差
测量仪表的示值误差简称测量仪表的误差,指“测量仪表示值与对应输入量的真值之差”。
这是测量仪表的最主要的计量特性之一,其实质反映了测量仪表准确度的大小。示值误差大,则其准确度低;示值误差小,则其准确度高。
示值误差是对真值而言的,由于真值是不能确定的,实际上使用的是约定真值或实际值。
按照不同的示值、性质或条件,测量仪表的误差又具有专门的术语。如基值误差、零值误差、固有误差、偏移等。
测量仪表的误差见表2-2。
表2-2 测量仪表的误差
续表
仪表精度=(绝对误差的最大允许值/仪表量程)×100 (2-55)
式(2-55)取绝对值去掉,是精度等级。
例如,0.5级电表的引用误差应不超过±0.5。我国过程检测控制仪表的精度等级分为0.005、0.02、0.05、0.1、0.2、0.35、0.4、0.5、1.0、1.5、2.5、4.0等;我国工业仪表等级分为0.10.2、0.5、1.0、1.5、2.5、5.0七个等级,并标注在仪表刻度标尺或铭牌上。级数越小,精度(准确度)就越高。
另外,要区别和理解测量仪表的示值误差、最大允许误差和测量不确定度之间的关系。
示值误差和最大允许误差均是对测量仪表本身而言的。最大允许误差是指技术规范(如标准、检定规程)所规定的允许的误差极限值,是判定测量仪表是否合格的一个规定要求,而示值误差是测量仪表某一示值其误差的实际大小,是通过检定、校准所得到的一个值,可以评价是否满足最大允许误差的要求,从而判断该测量仪表是否合格,或根据实际需要进行示值修正,以提高测量仪表的准确度。
测量不确定度是表征测量结果分散性的一个参数,它只能表述一个区间或一个范围,说明被测量真值以一定概率落于其中,它对测量结果而言,用以判定测量结果的可靠性。
示值误差、最大允许误差和测量不确定度具有不同的概念,前两者相对测量仪表而言,后者相对测量结果而言;前两者相对于真值(约定真值)之差,后者是一个区间范围;前两者可以对测量仪表的示值进行修正,后者无法对测量仪表进行修正。
2.5.3 精密度、准确度、精确度
1.精密度
测量值与平均值之差称为偏差。偏差表征测量结果的精密度。精密度即各测量值之间接近的程度,各测量值相互接近、比较集中,或者波动性小、则离散性小,则偏差就小,精密度也就越高。由于系统误差是恒定的,偏差或者测量值的波动性决定于随机误差,也即精密度决定于随机误差。
数理统计中,常用标准差(均方根偏差)衡量数据的离散程度,表征测量的精密度。
式中: ——求和,简写成∑;
μ0——测量的真值。
式(2-56)又称贝塞尔公式。
2.准确度
剔除粗大误差之后,测量值与真值之差可以表示测量的准确度。因为测量值与真值之差,即测量误差主要包括随机误差和系统误差,而随机误差体现为精密度,所以可以说准确度决定于系统误差与随机误差或精密度。
如果随机误差已基本消除,或者精密度很高,那么此时准确度主要决定于系统误差,所以精密度高是准确度高的前提。在精密度高的前提下,要使准确度高,还需要消除系统误差,否则,如果系统误差很大即使精密度高准确度也会很低。
图2-38中,假设圆心表示测量真值,图中小黑点表示每次测量的测量值。可以看出,图2-38(a)测量值忽左忽右,忽大忽小,偏离真值,因此测量的精密度不高,准确度也不高;图2-38(b)测量值集中偏右,但是偏离真值,因此测量的精密度高,准确度不高;图2-38(c)测量值集中在圆心附近,因此测量的精密度高,准确度高。
显然,从理论上讲,当已经完全消除系统误差,再通过无限多次测量完全消除随机误差,那么测量结果即等于真值。因此当不存在系统误差时,总体平均值可以作为真值。
图2-38 精密度、精确度、准确度概念
3.精确度
精确度是精密度与准确度两者的总和,只有测量值的精密度和准确度都高,才能称该测量的精确度高。图2-38(c)所示为精确度高。在测量中,希望得到精确度高的结果。
2.5.4 粗大误差、系统误差和随机误差的处理
(1)粗大误差的发现与剔除:首先应设法判断粗大误差是否存在,若存在粗大误差,必须将其剔除。检测人员应当严格认真,避免过失。
(2)系统误差的发现、修正或减小:系统误差的性质决定了它不可能通过增加测量次数来消除。可以通过选择较好的检测系统、提高操作水平等技术措施使得检测系统完善,予以消除或补偿系统误差;也可在发现系统误差后用修正值的方法予以修正。
(3)随机误差的减小或消除:引起随机误差的原因很多,难以掌握或暂时未能掌握的微小因素,一般无法控制。不能用简单的修正值来修正。人们在长期实践中发现,虽然对于一次的测量偶然误差无法预言,但是重复多次测量中,随机误差符合统计规律。根据这一特点,用概率和数理统计的方法,多次测量,计算随机误差出现的可能性大小,并用统计方法予以减小或消除。
测量数据处理过程中,应当首先发现并剔除粗大误差,然后发现、修正或减小系统误差,最后利用随机误差性质进行处理。
1.随机误差的处理
随机误差的处理任务:从随机数据中求出真值的最佳估计值,对数据可信赖程度进行评定并给出测量结果。在测量中,当系统误差已设法消除或减小到可以忽略的程度时,如果测量数据仍有不稳定的现象,说明存在随机误差。
在等精度测量情况下,n个测量值x1,x2,…,xn,设只含有随机误差δ1,δ2,…,δn。这组测量值或随机误差都是随机事件,应用概率统计方法来研究。多数情况下,测量过程的随机误差服从正态分布规律。
随机误差的正态分布的概率密度函数为
式中:y——概率密度;
x——测量值(随机变量);
σ——均方根偏差(标准误差);
μ0——真值(随机变量x的数学期望);
δ——随机误差(随机变量),δ=x-μ0。
正态分布方程式关系曲线如图2-39所示。说明:在x=μ0/δ=0处的附近区域内具有最大概率。
图2-39 正态分布方程式关系曲线
由图2-39可知:
(1)绝对值小的随机误差出现的概率大于绝对值大的随机误差出现的概率。
(2)随机误差的绝对值不会超出一定界限。
(3)测量次数n很大时,绝对值相等、符号相反的随机误差出现的概率相等。n→∞时,随机误差的代数和趋近于零(抵偿性)。随着测量次数的增加,取多次测量结果的平均值过程中,正负误差可以相互抵消,因此增加测量次数可以减小随机误差。
(4)随机误差动布是单峰的和有界的,且当测量次数足够多时,误差具有对称性。
相关概念介绍如下:
(1)算术平均值。对某一量进行n次等精度测量时,由于存在随机误差,测量值xi皆不相同,应对所有数据进行数据处理后作为测量结果。
算术平均值定义为
设各个测量值与真值的随机误差为eri,则eri=xi-μ0
因此,
实际测量时,真值μ0不可能得到。但如果随机误差服从正态分布,则算术平均值处随机误差的概率密度最大。算术平均值是诸测量值的最可信赖的表达,为测量的最佳估计值,它可以作为等精度多次测量的结果。由式(2-58)和(2-59)可知,随着测量次数的增加,算术平均值趋近于真值。
(2)标准差σ。标准差(标准偏差、均方根偏差、均方差、标准误差、标准差):算术平均值反映随机误差的分布中心,而标准差则反映随机误差的分布范围。标准差愈大,测量数据的分散范围愈大,如图2-40所示。所以,标准差σ可以描述测量数据和测量结果的精度。
在实际测量时,由于真值μ0是无法确切知道的,可用测量值的算术平均值代替,各测量值与算术平均值差值称为残余误差(残差),即。用残余误差计算的均方根偏差称为均方根偏差的估计值σs。
图2-40 不同σ的正态分布曲线
算术平均值的标准差为
式中,算术平均值 为真值μ0的最佳估计值;σs为有限次测量中单次测量的标准差; 为有限次测量算术平均值的标准差。由式(2-62)可知,n次等精度测量中,算术平均值的标准差为单次测量标准差的 ,且测量次数越多,算术平均值越接近被测量的真值,测量精度就越高。
(3)测量的极限误差。根据概率论知识可知,符合正态分布的随机误差动布曲线下的全部面积相当于全部误差出现的概率。根据随机误差的正态分布的概率密度函数式(2-57),可得
而随机误差在±δ范围内的概率为
引入变量t,令δ=tσ
则
若某随机误差出现在±tσ范围内的概率为2ф(t),则超出该误差范围的概率为
α=1-2ф(t) (2-66)
表2-3为不同t值的置信区间及其对应的置信概率Pα=2ф(t)及α。
表2-3 不同t值的置信概率
由表2-3可知,当t=1时,Pα=0.6827,即测量结果中随机误差出现在-σ~+σ范围内的概率为68.27,而|δ|>σ的概率为31.73。出现在-3σ~+3σ范围内的概率是99.73,因此可以认为绝对值大于3σ的随机误差出现的概率极低,是小概率事件,几乎不可能出现。通常把|δ|=3σ的随机误差称为极限误差σlim。因此,测量结果通常表示为
2.系统误差的根源、发现和消除
有效地找出系统误差的根源并减小或消除的关键是如何查找误差根源。通常需要对测量设备、测量对象和测量系统进行全面分析,明确其中有无产生明显系统误差的因素,采取相应措施予以修正或消除。
(1)系统误差的根源:
①所用传感器、测量仪表或组成元件是否准确可靠。如传感器或测量仪表灵敏度不足,仪表刻度不准确,变换器、放大器等性能不良,这些均会引起系统误差。
②测量方法是否完善。如用电压表测量电压,电压表的内阻会对测量结果有影响。
③传感器或仪表安装、调整或放置是否正确合理。如没有调好仪表水平位置,安装时仪表指针偏心等都会引起系统误差。
④传感器或仪表工作环境条件是否符合规定条件。如环境、温度、湿度、气压等的变化也会引起系统误差。
⑤测量者的操作是否正确。如读数时的视差、视力疲劳等都会引起系统误差。
(2)系统误差的发现方法:
①实验对比法。通过改变产生系统误差的条件,进行不同条件的测量以发现系统误差。这种方法适用于发现固定的系统误差。
如一台测量仪表本身存在固定的系统误差,即使进行多次测量也不能发现,只有用精度更高一级的测量仪表测量,才能发现这台测量仪表的系统误差。
②残余误差观察法。根据测量值的残余误差的大小和符号的变化规律,直接由误差数据或误差曲线图形判断有无变化的系统误差。
图2-41中把残余误差按测量值先后顺序排列,图2-41(a)的残余误差排列后有递减的变值系统误差;图2-41(b)则可能有周期性系统误差。
图2-41 残值误差变化规律
③准则检查法:
a.马利科夫准则:将残余误差前后各半分两组,若“Σvi前”与“Σvi后”之差明显不为零,则可能含有线性系统误差。
b.阿贝-赫梅特检验法则:适于判断、发现和确定周期性系统误差。操作方法:将同一条件下顺序重复测量得到的测量值按序排列,求出相应残差vi。计算A==|v1v2+v2v3+…+vn-1vn|若(σ为测量数据序列标准差),则表明测量值中存在周期性系统误差。
c.正态分布比较判别法:检查残余误差是否偏离正态分布,若偏离可能存在变化的系统误差。
(3)系统误差的消除方法:
①在测量结果中进行修正。对于已知的系统误差,可以用修正值对测量结果进行修正;对于变值系统误差,设法找出误差的变化规律,用修正公式或修正曲线对测量结果进行修正;对未知系统误差,则按随机误差进行处理。
修正值是指为清除或减少系统误差,用代数法加到未修正测量结果上的值,用C表示。修正值和绝对误差大小相等,符号相反。
A0=x+C (2-68)
注意:要正确区别误差、偏差和修正值的概念,应用时要注意误差和偏差区别。
偏差是一个值减去其参考值,对于实物量具而言,偏差就是实物量具的实际值对于标称值偏离的程度,即偏差=实际值-标称值。
例如,有一块量块,其标称值为10mm,经检定其实际值为10.1mm,则该量块的偏差为10.1mm-10mm=+0.1mm,说明此量块相对10mm标准尺寸大了0.1mm。
此量块的误差为示值(标称值)-实际值,即误差=10mm-10.1mm=-0.1mm,说明此量块示值比真值小了0.1mm,故此量块在使用时应加上0.1mm修正值。
修正值是指为清除或减少系统误差,用代数法加到未修正测量结果上的值,和误差大小相等,符号相反。
这三个概念量值的关系:误差=-偏差;误差=-修正值;修正值=偏差。
②消除系统误差的根源。在测量之前,仔细检查、正确调整和安装仪表;防止外界干扰;选好观测位置,消除视差;选择环境条件比较稳定时进行读数。
③在测量系统中采用补偿措施。找出系统误差规律,在测量过程中自动消除系统误差。如用热电偶测量温度时,热电偶参考端温度变化会引起系统误差,消除此误差办法之一是在热电偶回路中加一个冷端补偿器,实现自动补偿。
④实时反馈修正。自动化测量技术及微机的应用使得实时反馈修正的办法消除复杂的变化系统误差成为可能。当查明某种误差因素变化对测量结果有明显的复杂影响时,应尽可能找出其影响测量结果的函数关系或近似函数关系。测量过程中,用传感器将这些误差因素的变化转换成某种物理量形式(一般为电量),及时按照其函数关系,通过计算机算出影响测量结果的误差值,对测量结果进行实时自动修正。
3.粗大误差的发现和剔除
对重复测量所得一组测量值进行数据处理之前,首先应将具有粗大误差的可疑数据(坏值)找出、剔除。但绝不能凭主观意愿对数据任意进行取舍,而要有一定根据。原则是看这个可疑值的误差是否处于随机误差的范围之内,是则留,不是则弃。
常用准则:
(1)3σ准则(拉依达准则)。常把等于3σ的误差称为极限误差。3σ准则就是如果一组测量数据中某个测量值的残余误差的绝对值|vi|>3σ时,则该测量值为可疑值(坏值),应剔除。此处σ为均方根偏差的估计值。
当测量次数n比较少时,宜采用如下两准则:
(2)肖维勒准则。肖维勒准则以正态分布为前提,假设多次重复测量所得n个测量值中,某个测量值的残余误差|vi|>Zcσ,则剔除此数据。实用中,Zc<3,所以在一定程度上弥补了3σ准则的不足。
(3)格拉布斯准则。某个测量值的残余误差的绝对值|vi|>Gσ,则判断此值中含有粗大误差,应予剔除。此即格拉布斯准则。G值与重复测量次数n和置信概率Pα有关。
2.5.5 多次测量结果的表达
1.等精度测量数据处理方法
设对某被测量进行了n次等精度、独立的测量。多次测量结果中,应该修正、减小系统误差,剔除粗大误差,在系统误差修正的基础上,测量次数越多,随机误差越小。
一般取多次测量结果的算术平均值作为最后的测量结果。多次测量结果中,假设已经剔除粗大误差,修正了系统误差,则计算算数平均值,如果n次测量结果分别为x1,x2,…,xi,…,xn,则
(1)计算n次测量数据的算术平均值:
(2)计算标准差σs:
(3)检查有无粗大误差:若残差超过3σs,则予以剔除,然后重复步骤(1)~步骤(3),直到无粗大误差为止。
(4)计算测量算术平均值的标准偏差:
(5)写出测量结果表达式:
测量随机误差符合正态分布的前提下,根据数理统计,测量结果落在多次测量的算术平均值的范围的概率高达99.73。
例2-4对某物体长度测量11次,测量的数据见表2-4。
表2-4 例2-4数据
解 n=11
(1)算术平均值为
(2)标准差为
(3)检查有无粗大误差。通过计算发现,第7次测量剩余误差最大,为ν7==0.22cm,不超过3σs=0.258cm,认为11个测量数据中没有含粗大误差的坏值存在。
(4)算术平均值的标准差为
(5)测量结果表达式为
2.不等精度测量数据处理方法
在不等精度测量时,对同一被测量进行m组测量,得到m组测量列(进行多次测量的一组数据称为一测量列)的测量结果及其误差,它们不能同等看待。精度高的测量列具有较高的可靠性,将这种可靠性的大小称为“权”。“权”反映为各组测量结果相对的可信赖程度。测量次数多,测量方法完善、测量仪表精度高、测量的环境条件好、测量人员的水平高、则测量结果可靠,其权也大权是相比较而存在的权用符号p表示。
(1)权值的计算:
①用各组测量列的测量次数n之比表示,取测量次数较小的测量列的权为1,则
p1∶p2∶…∶pm=n1∶n2∶…∶nm
②用各组测量列的误差平方的倒数之比表示,取误差较大的测量列的权为1,则
(2)加权算术平均值的计算。加权算术平均值不同于一般的算术平均值,应考虑各测量列的权重的情况。若对同一被测量进行m组不等精度测量,则可得到m个测量列的算术平均值,相应各组的权分别为p1,p2,…,pm,则加权平均值可用式(2-73)表示,即
(3)加权算术平均值的标准误差,可用式(2-74)表示,即
2.5.6 测量误差的合成
一个测量系统或一个传感器都是由若干部分组成的。设各环节为x1,x2,…,xn,系统总的输入输出关系为y=f(x1,x2,…,xn),而各部分又都存在测量误差。若已知各环节的误差而求总的误差,称为误差的合成;反之,总误差确定后,要确定各环节具有多大误差才能保证总的误差值不超过规定值,称为误差的分配。
通过一系列的误差动量,用计算方法求得最终误差,误差动量和最终结果间不像间接测量那样有明确的函数关系。
例如在检测系统设计过程中,已知各组成环节的系统误差和随机误差,应该通过误差合成的方法得到最终的总误差。
误差有系统误差、随机误差和粗大误差之分,但是粗大误差是应当避免和在数据处理之初予以剔除的,因此误差的合成只包括随机误差的合成、系统误差的合成以及随机误差与系统误差的合成三种。
1.随机误差的合成
设有N个随机误差动量,已知各个随机误差动量项的标准差为σ1,σ2,…,σn,求总的合成误差σΣ。
根据随机误差合成的均方根法,设各个随机误差独立,则
例2-5 通过间接测量法测量电阻器消耗的功率,P=I2R,测得电阻R=1Ω,测得电流I=5A,标准差分别为σR=0.0028Ω,σI=0.007A,试求功率的标准差。
解根据随机误差的合成,得
2.系统误差的合成
对于误差大小和正负已知的系统误差,合成时只需要取其代数和即可,或者用修正的方法消除掉。对于未定的系统误差,有不确定度代数相加法和方和根法两种常用合成方法。
(1)不确定度代数相加法。设有n个系统误差动量,其不确定度分别为es1,es2,…,esn,求总的合成误差es。
则
(2)方和根法。即各个系统误差不确定度二次方相加。
3.随机误差与系统误差的合成
设测量系统和传感器的系统误差和随机误差均为相互独立的则总的合成误差ε可表示为
ε=es±σΣ (2-78)
工程习惯上,系统误差和随机误差都用标准差表示,然后再以平方和方式合成。
2.5.7 测量误差的分配
预先对检测系统的总误差提出要求,求出各单项误差的值,对设计一个性能良好的检测系统非常重要,这就涉及误差的合理分配问题。工程上,通常首先根据等误差原则进行分配,即令每个直接测量值的系统误差(绝对误差表示,标准差。其中,n为参加误差分配的直接测量值(或构成环节)的个数。据此求出的误差分配值是一个初步参考值,而后再根据仪器设备的精度、测量技术条件等实际情况做适当调整。
2.5.8 有效数字
测量过程中,各种测量需要记录下来经过运算得到分析结果,那么,应该如何记录测量值?
1.有效数字
各种测量值,例如试样长度2.54cm,电压1.25V等,既说明了数量的大小,而且也反映了测量的准确度。这是通过有效数字实现的。
所谓有效数字,是实际能够测量的数字。在测量过程中可以把有效数字的位数定义为与仪表精度相符的测量值的位数。有效数字的位数决定于测量仪表的精度,只有数据中的最后一位是可疑数字,所以根据测量值的记录结果便可以推知所用仪表的精度。
例如,试样长度2.50cm,说明是使用最小刻度为毫米的尺子测量得到的结果,相对误差为;而2.500mm,说明是使用千分尺测量得到的结果,相对误差为γ=。似乎数值大小一样的两次测量,由于有效数字的概念而千差万别(相对误差相差整整10倍)。
在确定有效数字位数时,应注意问题如下:
数字“0”,当数字“0”位于1~9数字后面时,为有效数字;位于1~9数字前面时只起定位作用。例如:10.20有4位有效数字,而0.0106只有3位有效数字,其中前两个“0”只起定位作用。
科学计数法中,明确表明了有效数字的位数。例如,6.5×104,表示2位有效数字,6.50×104,表示3位有效数字。
计算中涉及的常数,例如π,,e等认为其有效位数很多或者无限多,可以根据计算需要自行取舍。
2.数据处理时数字修约规定
一般常用的数字修约法为“四舍五入”。如果在“四舍五入”方法中把数据修约成n位有效数字,各种情况的舍入误差见表2-5。
表2-5 各种情况的舍入误差
由于在大量数据运算中第n+1位上出现数字1,2,…,9的概率相等,所以1,2,3,4舍去时的负误差与9,8,7,6作为10进位时产生的正误差可以相抵消,而逢五进位而产生的正误差无法抵消,而且这种人为的舍入而引入的正误差是累积性的。
为解决上述问题,人们提出“四舍六入五成双”这种更为科学的数字修约方法。
所谓“四舍六入五成双”,是当第n+1位数字小于或等于4则舍,大于或等于6则入;当第n+1位数字=5时,根据第n位数字决定取舍,第n位数字为奇数则入,为偶数则舍(使第n位数字为双)。这样,由于第n位数字为奇数或偶数的概率各半,于是第n+1位的数字5的舍入概率各半,舍入误差相互抵消。因此“四舍六入五成双”不会引入累积性舍入误差。
3.测量值的记录及运算
(1)正确记录测量值。记录实验数据时保留一位可疑数据。例如,用最小刻度为毫米的尺子测量长度,长度记录为3mm,3.15mm都不对,应记为3.1mm;而用千分尺测量长度,长度记录为3.15mm,3.1560mm都不对,应记为3.156mm。
(2)正确表达分析结果。分析结果是由实验数据计算得来的,所以分析结果的有效数字位数由实验数据的有效数字位数决定。计算过程涉及乘除法时,实验数据的有效数字位数为几位,分析结果的有效数字的位数也应是几位;计算过程涉及加减法时,实验数据的有效数字位数一般为1位或2位。
2.5.9 数据处理实例
例2-6 铜的电阻值R与温度t之间关系为Rt=R0(1+αt),在不同温度下,铜电阻的阻值见表2-6。试用最小二乘法估计0℃时的铜电阻电阻值R0和铜电阻的电阻温度系数α。
表2-6 不同温度下铜电阻电阻值
最小二乘法原理是指测量结果的最可信赖值,应在残余误差平方和为最小的条件下求出。在等精度测量和不等精度测量中,用算术平均值或加权算术平均值作为多次测量的结果,因为它们符合最小二乘法原理。最小二乘法原理是误差数据处理中一种重要的数据处理手段。
在自动检测系统中,两个变量间的线性关系是一种最简单,也是最理想的函数关系。设有n组实测数据(xi,yi)(i=1,2,…,n),其最佳拟合方程(回归方程)为
Y=A+Bx (2-79)
式中:A——直线的截距;
B——直线的斜率。
图2-42 最小二乘法原理图
最小二乘法原理图如图2-42所示。
根据最小二乘法原理,要使为最小,将其对A、B求偏导数,并令其为零,可得两个方程,联立两个方程可求出A,B的唯一解。
则
解 列出误差方程:
Rti-R0-(1+αt)=γi (i=1,2,3,…,7)
0式中,Rti是在温度ti下测得铜电阻电阻值。令x=R0,y=αR0,则误差方程可写为
76.3-(x+19.1y)=γ1
77.8-(x+25.0y)=γ2
79.75-(x+30.1y)=γ3
80.80-(x+36.0y)=γ4
82.35-(x+40.0y)=γ5
83.9-(x+45.1y)=γ6
85.10-(x+50.0y)=γ7