2.6 数据解析方法
2.6.1 扫描电镜分析
扫描电子显微镜是1965年发明的较现代的微观物质研究工具,主要是利用二次电子信号成像来观察样品的表面形态,即用极狭窄的电子束去扫描样品,通过电子束与样品的相互作用产生各种效应,其中主要是样品的二次电子发射。二次电子能够产生样品表面放大的形貌像,这个像是在样品被扫描时按时序建立起来的,即使用逐点成像的方法获得放大像。
其基本原理是当一束高能的入射电子轰击物质表面时,被激发的区域将产生二次电子、俄歇电子、特征X射线和连续谱X射线、背散射电子、透射电子,以及在可见、紫外、红外光区域产生的电磁辐射。同时,也可产生电子-空穴对、晶格振动 (声子)、电子振荡 (等离子体)。原则上讲,利用电子和物质的相互作用,可以获取被测样品本身的各种物理、化学性质的信息,如形貌、组成、晶体结构、电子结构和内部电场或磁场等。扫描电子显微镜正是根据上述不同信息产生的机理,采用不同的信息检测器,使选择检测得以实现。如对二次电子、背散射电子的采集,可得到有关物质微观形貌的信息;对X射线的采集,可得到物质化学成分的信息。
利用扫描电子显微镜可对大气颗粒物的表观形貌、形态、晶体结构及化学组成进行分析,通过将大气样品和污染源样品进行比较,来判断大气样品中颗粒物的主要污染来源。此方法作为大气颗粒物源解析的辅助工具,为源解析研究提供了定性和半定量的依据,已经得到很多研究学者的应用。
2.6.2 主成分分析
主成分分析法(Principal Component Analysis, PCA)是由Pearson在1901年提出,再由Hotelling在1993年加以改进的一种统计方法。由于在多变量的研究中,往往变量个数太多,并且彼此之间存在一定的相关性,而使所测量的数据在一定程度上反映的信息有所重复,而且当变量较多时,在高维空间中研究样本的分布规律比较麻烦。主成分分析正是把这种情形进行简化,采取一种降维的方式,找出几个综合因子来代表原来的变量,使这些综合因子尽可能地反映原来的变量,而且彼此之间相互不关联。也就是说,主成分分析方法的主要目的是减少变量数目,使其成为少数几个独立的线性组合变量,经由线性组合得到的主成分变量数会成为最大,使其显示出最大的个别差异,从而把多个变量化为少数几个综合指标的一种统计方法。主成分分析除了概述变量间的关系外,也可用来削减回归分析或聚类分析中变量的数目。
绝对主成分分析(Absolute Principal Component Analysis, APCA)主要是先经由变量的相关系数矩阵解出主成分的特征向量,再以极变正交转轴法使特征向量中各元素的因子负荷分别趋近1或0,所得的一组新的主成分(或因子)具有简单的结构,可以代表特定污染源中所含的化学元素组成,再以气溶胶浓度或质量对和污染源所代表的因子进行多元回归分析,其回归系数即各排放源在该接受点的贡献分率,而且由因子分析的结果可得到各排放源所含化学元素的浓度剖面。此项研究成果是否合理,可以从比较气溶胶浓度量测值误差及比较各污染源浓度剖面量测值与估算值误差两方面来检验。
其基本思想是设法将原来众多具有一定相关性的指标(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2,即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四、…、第P个主成分。 基本数学表达式如式(2-2):
Fp=a1iZX1+a2iZX2+……+apiZXp (i=1,…,m) (2-2)
式中 a1i, a2i, …,api——X的协方差阵∑的特征值对应的特征向量;
ZX1, ZX2, ……, ZXp——原始变量经过标准化处理的值。
因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化。
主成分分析主要步骤如下:
(1)指标数据标准化(软件自动执行);
(2)指标之间的相关性判定;
(3)确定主成分个数m;
(4)主成分Fi表达式;
(5)主成分Fi命名。
本书采用SPSS软件对大气颗粒物主成分进行分析,将分析结果与污染源样品成分谱进行比较,来推估大气颗粒物的主要污染源。另外,主成分分析结果会结合下一步的化学质量平衡模式推估结果做出最终污染源的判断,从而提高污染源解析的准确性。
2.6.3 化学质量平衡受体模式
化学质量平衡受体模式(Chemical Mass Balance Receptor Model, CMB)是空气污染源管理最常用的一种受体模式,用以了解不同污染源的贡献量,也是目前最为广泛应用的源解析模式。受体模式根据污染源与受体点所测得的空气污染物的物理和化学特性,针对不同污染源的污染贡献量进行定性及定量分析。CMB受体模式是由多元线性方程式所组成,可用以表示不同污染源对受体污染物的贡献量。CMB模式可处理多种污染物的数据,在大气颗粒物源解析中主要以PM10、PM2.5及VOCs研究为主。
基本理论是假设受体点所收集到的污染物是由不同污染源排放的化学成分重叠组成,即受体点的污染物浓度为不同污染物的线性组合,利用质量守恒原理与数学统计方式推估污染源的种类及贡献量。
CMB模型假设污染源排放的颗粒物物种从排放到进入受体的过程中为质量守恒,则受体点污染物浓度与排放源该污染物浓度之间的关系如式(2-3):
(2-3)
式中 Ci——受体点颗粒物中元素i的浓度测定值(μg/m3);
Sij——污染源j对受体点颗粒物中元素i的贡献率;
Fij——污染源j所排放颗粒物中元素i的浓度测定值(μg/m3);
Ei ——相似不确定性误差(μg/m3)。
受体模式运用过程中与实际情况在某些方面会有不符,所以在应用之前应做以下几种假设:
(1)污染源排放的污染物在大气中的物化特性维持不变;
(2)颗粒物中各化学组分彼此间互不反应;
(3)各污染源排放至受体的污染物的物化特性均具有明显的差异性;
(4)污染源的数目或范围不可小于或等于污染物种的数目;
(5)各污染源化学成分谱的关系均为线性独立;
(6)采样、分析及测量产生的误差是随机的且呈正态分布。
本书所采用的化学质量平衡模式是美国内华达州沙漠研究所(Desert Research Institute,DRI)开发的CMB8软件,并利用该软件进行污染源种类及贡献率的推估。源解析所采用的污染源成分谱选自美国环境保护总署整理的污染源指纹数据库和美国南加州空气质量研究(Southern California Air Quality Study,SCAQS)数据库,选取的污染源主要有土壤扬尘、道路扬尘、交通污染源、钢铁业、水泥业、燃煤电厂、石化工业及农业废物燃烧等。
2.6.4 富集因子分析
富集因子分析法的目的在定性判断受体点的非自然界污染源。参考元素与参考污染源通常选取受体点自然界存在之污染源,假定选择元素R做参考元素,将大气颗粒物中待考查元素i的富集因子为:
EFi=(Xi/XR)颗粒物/(Xi/XR)参考污染源 (2-4)
式中 Xi——受体点元素i的浓度;
XR——点参考元素R的浓度。
选取参考污染源时可因地点而异,例如英国靠海,即以海盐为参考污染源,以Mg为参考元素。一般地区可以当地土壤为参考污染源。由于我国哈尔滨市20种土壤元素背景值的资料搜集难度较大,故没有选择地表土壤元素背景值作为元素富集因子的基准,而是依据1976年我国地质学家黎彤提出的地壳元素丰度计算富集因子。通过对Fe、Al和Si三种常用参比元素进行比较发现,所得元素富集因子差异不大,因此我们选择Fe作为参比元素。
如果某种元素的EF值小于1时,则可以认为相对于地壳来说没有富集,它们主要是由土壤或岩石的尘埃刮入大气中造成的;如果EF值大于10,则表示该元素在颗粒物中有明显的富集,这些元素不仅有地壳物质的贡献,而且可能与人类的各种活动有关。
2.6.5 正定矩阵因子分析
正定矩阵因子分析(PMF)属于约束条件下的因子分析方法,由芬兰Paatero教授在20世纪90年代提出,为USEPA推荐使用源解析模型。PMF模型是利用最小二乘法处理分析因子问题,与传统因子分析法不同的是,PMF方法对因子约束为非负,且非正交,这样是每个因子都具有实际意义,即:
X=GF+E (2-5)
(2-6)
(2-7)
(i=1,2…n;j=1,2…m;k=1,2…p)
式中 m——化学成分数;
n——样本数;
p——主要污染源的数目;
X——浓度,是n×m矩阵;
G——污染源贡献,是n×p矩阵;
F——源轮廓线,是p×m矩阵;
E——n×m的残差矩阵,为实际数据与解析出的结果二者的差值;
sij——标准偏差;
Q(E)——残差与观测数据的标准差比值的平方和。
X矩阵为主要输入矩阵,并需计算每个数据的不确定性,将不确定数据也作为主要输入数据。G和F矩阵为主要输出矩阵,因PMF模型对各因子实行非负限值,故G和F矩阵中所有项为非负值。近年来,PMF模型越来越受到人们的重视,国内外许多学者应用PMF模型做大气环境方向的研究。