第四节 分析数据的统计处理
在定量分析中,通常是将多次平行测定的数据取平均值作为分析结果加以报告。事实上这不是最确切的,还应运用数理统计的方法对有限次测量的数据进行分析、评价,才能对分析结果的可靠性做出科学的判断。本节介绍分析数据的统计处理基本知识。
一、可疑值的取舍
在实际的定量分析工作中,常会遇到在一组平行测定的数据中,个别数据比其他数据过高或过低的情况,我们通常将这种数据称为可疑值(或逸出值)。例如,在平行分析测定某样品的含量时得到四个数据,分别为83.05%、83.67%、83.66%和83.68%,显然83.05%偏离其他三个值较多,视之为可疑值。那么在结果分析中如何处理可疑值呢?如可疑值确因实验中的过失所造成,则应该舍弃,否则就必须按数理统计方法进行处理,确定其取舍。取舍的方法很多,常用的有Q检验法、G检验法和四倍法等。本节只介绍Q检验法。
Q检验法又称舍弃商法,适用于平行测定次数较少(n=3~10)的情况。在一定置信度下,Q检验法按下列步骤进行分析,判断可疑数据是否舍去。
(1)将所有测量值按从小到大排列:x1,x2,x3…xn-1,xn,在序列开头(x1)或末尾(xn)找出可疑值。
(2)计算测量值的极差(x最大-x最小)和可疑值与邻近值之差(x疑-x邻)。
(3)计算出统计量Q计,如下。
Q计= (2-8)
(4)根据测定次数和置信度要求从表2-1中查得Q表,如果Q计<Q表,则保留可疑值,否则应舍弃。
表2-1 不同置信度下的Q值
【示例3】 用化学分析法平行测定某矿石试样中钒的百分含量(%),4次分析测定结果分别为20.39、20.41、20.40和20.16,用Q检验法判断20.16是否舍弃(置信度为90%)。
解:将测定值由小到大排列为20.16、20.39、20.40、20.41;针对可疑值计算统计量Q计。
Q计===0.92
查表2-1,在90%的置信度时,当n=4,Q表=0.76<Q计。因此,该数值舍弃。
二、分析结果的表示方法
定量分析中,在忽略系统误差的情况下,一般对每种试样平行测定3次,计算相对平均偏差。若相对平均偏差不超过0.2%,则认为符合要求,可直接用平均值表示分析结果;否则,此次实验不符合要求,需重新实验。
如果是制定分析标准或涉及重大问题的样品分析、科研成果等所需的精确数据。则需要多次对样品进行平行测定直到获得足够的数据。经过统计方法进行处理后,方可得到分析报告。报告中,需要的参数有平均值、测定次数、标准偏差及相对标准偏差。
三、分析结果的显著性检验
在定量分析中,常遇到这样一些情况:用两种不同分析方法对同一试样进行分析的结果有差异;对标准试样进行分析所得平均值与标准值有差异;不同的分析人员或不同的实验室对同一试样的分析结果有差异。这些差异都是由定量分析中的系统误差或偶然误差引起的。因此,必须对分析结果的准确度或精密度是否存在显著性差异做出判断。在定量分析中,分别检验两组分析结果是否存在显著的偶然误差和系统误差的最常用方法是F检验法和t检验法。
1. F检验法
F检验法(F test)是通过比较两组数据的方差(标准偏差的平方)来判断它们是否存在显著性差异,即判断两组分析结果的偶然误差是否显著不同。F检验法的实施步骤如下。
(1)计算两个样本的方差:和。
(2)按式(2-9)计算两个样本方差和的比值F计。
(2-9)
(3)确定合适的显著性水平后,从F值表中查出F表。表2-2是95%置信度(α=0.05)时,不同自由度下的部分F值。该值与置信度及S1和S2的相应自由度f1、f2有关。表中f1为大方差数据的自由度,f2为小方差数据的自由度。
(4)判断:若F计<F表,则表明两组数据的精密度无显著性差异;反之,则有显著性差异。
表2-2 95%置信水平(α=0.05)时的部分F值
【示例4】 甲、乙二人对同一试样用不同方法进行测定,得两组测定值。甲:1.26、1.25、1.22。乙:1.35、1.31、1.33、1.34。问:两种方法间有无显著性差异?
解:n1=3,S1=0.021
n2=4,S2=0.017
f1=3-1=2,f2=4-1=3,查表2-2得F表=9.55
F计=1.53<F表,所以,S1和S2无显著性差异,即两种方法的精密度无显著性差异或彼此精密度相当。
2. t检验法
t检验法(t test)是通过比较两组平均值或比较平均值与标准值,以判断某种分析方法或操作过程中是否存在显著性系统误差的检验方法。
(1)样本均值与标准值的比较 样本均值与标准值的比较是用来评价样本的平均值与真值或基准试样的测定值是否有差异。检验分析的步骤如下。
①求出多次平行测定试样的平均值和标准偏差S后,按式(2-10)计算t计。
(2-10)
②查t分布表(表2-3),得t表。
③比较判断 若t计≥t表,则平均值与标准值μ之间存在显著性差异,表明该方法或操作过程有系统误差;若t计<t表,则平均值与标准值μ之间无显著性差异,虽然有差异,但这种差异可能是偶然误差造成的。
表2-3 t分布表
(2)两组平均值的比较 分为两种类型的比较:①对同一试样由不同分析人员或同一分析人员采用不同分析方法所得不同结果的平均值进行比较;②对两个试样中同一成分,用相同方法测得的两组数据的平均值进行比较。
要判断两组数据之间是否存在系统误差,方法是先对两组数据进行F检验,确定两组数据的精密度无显著性差异之后,再进行t检验,才会得出正确的结论。这种情况下的t检验应按下式计算t计。
(2-11)
式中,、分别为第1、第2组数据的平均值;n1、n2分别为第1、第2组数据的测定次数;Sm为合并标准偏差或组合标准偏差。若已知S1和S2之间无显著性差异(F检验法),可由下式计算出上式中的Sm。
(2-12)
药物分析中,t检验一般为双侧的检验。
【示例5】 采用丁基罗丹明(B-Ge-Mo)杂多酸光度法测定中药中Ge的含量(μg)。已知标样值为10.77μg,9次平行测定结果为:10.74、10.77、10.77、10.77、10.81、10.82、10.73、10.86、10.81,通过计算说明该方法是否有系统误差(置信度为95%)。
解:P=0.95 f=8 =10.79 S=0.042
查t值分布表得:t表=2.31>t计,说明与μ无显著性差异,新方法无系统误差。
点滴积累
1.在定量分析中出现的个别过高或过低的数据称为可疑数据。对可疑值的取舍,一般按数理统计方法进行处理确定,常用的有Q检验法和G检验法。
2.定量分析中分别检验两组分析结果是否存在显著的偶然误差和系统误差的常用方法是F检验法和t检验法。
3. F检验的目的是判断两组数据间存在的偶然误差是否有显著不同;t检验的目的是判断某一分析方法或操作过程中是否存在较大的系统误差。
目标检测
一、选择题
1.四位学生进行水泥熟料中SiO2、CaO、MgO、Fe2O3、Al2O3的测定。下列结果(均为百分含量)表示正确的是( )
A. 21.84、65.5、0.91、5.35、5.48
B. 21.84、65.50、0.910、5.35、5.48
C. 21.84、65.50、0.9100、5.350、5.480
D. 21.84、65.50、0.91、5.35、5.48
2.准确度和精密度的正确关系是( )
A.准确度不高,精密度一定不会高
B.准确度高,要求精密度也高
C.精密度高,准确度一定高
D.两者没有关系
3.以下有关系统误差的叙述,错误的是( )
A.误差可以估计其大小
B.误差是可以测定的
C.在同一条件下重复测定,正负误差出现的机会相等
D.它对分析结果影响比较恒定
4.滴定终点与化学计量点不一致,会产生( )
A.方法误差
B.试剂误差
C.仪器误差
D.偶然误差
5.下列误差中,属于偶然误差的是( )
A.砝码未经校正
B.容量瓶和移液管不配套
C.称量时空气湿度的微小变化导致称量不准
D.重量分析中,沉淀的溶解损失
6.可用于减少测定过程中的偶然误差的方法是( )
A.进行对照试验
B.进行空白试验
C.进行仪器校准
D.增加平行试验的次数
7.下列有效数字位数错误的是( )
A.[H+]=6.3×10-12mol/L(两位)
B. pH=11.20(四位)
C. cHCl=0.02502mol/L(四位)
D. 2.1(两位)
8.由计算器算得的结果为0.01644496。按有效数字运算规则,应将结果修约为( )
A. 0.016445
B. 0.01645
C. 0.01644
D. 0.0164
9.在滴定分析法测定中出现下列情况,哪种会导致系统误差?( )
A.试样未经充分混匀
B.滴定管的读数读错
C.滴定时有液滴溅出
D.砝码未经校正
10.今欲配制K2Cr2O7标准溶液,所用分析天平的准确度为±0.1mg,若要求相对误差≤±0.2%,则用减重法称取K2Cr2O7的质量至少应达到( )
A. 0.1g
B. 1.0g
C. 0.2g
D. 2.0g
二、简答题
1.常量滴定管估计到±0.01ml,若要求滴定的相对误差小于0.1%,在滴定时,耗用体积应控制在多少?
2.微量分析天平可称准至±0.001mg,要使称量误差不大于1‰,至少应称取多少试样?
三、计算题
1.用两种不同分析方法对矿石中铁的质量分数进行分析,得到两组数据如下。
试确认在置信度为90%时,两组数据的标准偏差是否存在显著性差异。
2.根据有效数字运算规则,求出下列结果。
①7.9936/0.9967-5.02 ②0.0325×5.103×60.6/139.8
③213.64+4.4+0.3244 ④5.2047×0.854+6.12-3.804
3.用沉淀滴定法测定纯NaCl中氯的百分含量,得到下列结果(%):59.82、60.06、60.46、59.86、60.24。计算测定结果的平均值、相对平均偏差、标准偏差、相对标准偏差、平均结果的相对误差。