2.4 暴露评估原理及方法
暴露评估同剂量反应评估一样,是食品加工过程风险评估最重要的步骤,同时因为和加工过程及加工工艺紧密相关,因此,暴露评估可以说是食品加工风险评估最有特色的重点环节。暴露评估最核心也是最常用的是概率风险评估(PRA),同时针对食品加工过程中食品基质载体中出现危害往往是多种危害混合存在,因此本节重点介绍概率评估方法以及多种危害存在情况下暴露评估技术。
2.4.1 概率评估方法
概率评估是暴露评估常常采用的主要方法,其通过产生一个风险的概率分布来量化有毒物对人体健康威胁的风险评价。通过概率分布来表征人群中不同的风险水平的可能性(即变异性)和风险评估的不确定性,这种不确定性可以通过概率分布的每个百分位的置信区间来表征。风险概率分布通常代表了潜在暴露人群在风险评估中的变异性,此外,PRA也可用来量化风险评估中的不确定性因素,这有利于风险评估员对风险超过关注水平的可能性做出判断(Krewski and Zhu,1994)。
2.4.1.1 概率评估分析对象特性
(1)不确定性
不确定性和变异性都是概率风险评估的基本术语。正如前面提到的,概率风险评估的一个主要目的就是分析变异性和不确定性对风险评估的影响。
不确定性是来源于对参数、模型或当前的其他因素[或不完全了解的未来状态(信息缺乏)],不确定性来自于不了解所致。例如,我们无法确定在污染处的某种污染物的平均浓度以及无法确定摄取的某些特定度量(如美国所有成年男性鱼类消费率的第95百分位数)。不确定性往往可以通过收集更多更好的数据来降低。
风险评估不确定性的潜在来源可分为3大类,即参数不确定性、模型不确定性和场景不确定性。
①参数不确定性 参数不确定性是风险评估过程中产生的一种不确定性,它发生在风险评估过程的每一个步骤,从数据的收集与分析到风险评估。参数不确定性可能是在有害废物场地进行风险评估时最容易被确认的不确定性来源。参数不确定来源可能包括:数据采集过程中的测量误差和系统误差,分析测量的不精确性推论,以及当数据集不能在研究中代表变量时,采用外推法对有限数据集进行推断或采用替代变量代替关键变量。从随机样本到目标群体的参数估计中用到的不确定性的统计概念(例如,算术平均数、标准差等都会导致参数的不确定性)。简而言之,风险评估中参数的不确定性由现有数据的质量、数量、结构和代表性以及统计估算方法而产生。在点风险评估中,参数不确定性可以采用多变量定性方法来解决。举例来说,土壤取样中产生的小样本量不能代表整体的污染物浓度,因此风险评估结果可能超过或低于实际风险。
②模型不确定性 模型的不确定性是指由于对真实过程必要的简化而导致的不确定性。其中包括错误地使用专门化模型,使用不当的替换变量,相关假设的简化,输入变量的选择,输入变量的概率分布选择以及来源于实证数据用于校准模型的内插法或外推法等。
③场景的不确定性 场景的不确定性是指利用缺失或不完整信息来确定暴露的不确定性。这可能包括关于化学物接触或毒性数量和程度的描述性错误、时间和空间聚合错误、不完整分析(即缺失暴露途径),以及潜在的暴露人群或暴露单位不协调的程度。
描述这几类不确定性来源非常重要,因为它们会影响到点评估和概率风险评估的风险管理决策的可信度。PRA中有各种各样的方法可以用来有效地量化不确定性,以增加风险管理决策的可信度。
(2)变异性
变异性是指发生在一个群体中由于真正的异质性或多样性而导致的可以被观察到的差异。变异性是由自然随机过程、环境、生活方式以及个体间的基因差异而导致的结果。例如,人的生理变异、土壤类型变异以及环境污染物浓度变异。生理变异包括体重、身高、呼吸频率、饮用水摄入率等方面的不同,环境污染物浓度变异是指在不同介质(如空气、水、土壤等)中污染物的浓度是不同的。在人类健康风险评估中,导致风险变异性的因素有环境污染物浓度变异性、摄入率或暴露频率差异等。
变异性通常以标准差或方差进行衡量,代表着由环境、生活方式和遗传等因素引起的个体差异。例如,饮用同一水源的人群,虽然污染物浓度相同,但食用这些水的风险可能会有所不同。这可能是由于不同暴露量(即不同的人喝不同量的水、不同的体重、暴露频率、暴露时间),以及不同的反应(例如,化学剂量耐性的遗传差异)。一个人群内个体之间差异称为个体间差异,而同一个体在不同时间的差异称为个体内差异。
通过额外测量或研究,变异的不确定性可以得到改善,但不可能降低变异性,因为变异性是进行群体评估时一个固有特点。但变异性可以通过广泛的数据得到更好的表征,但它并不能减少或消除。举例来说,如果我们要研究某一物种(白足鼠)部分个体的体重,我们会发现一系列的体重。这群小鼠的体重分布,在统计上可以用样品体重的平均值、范围和标准差来描述。虽然我们对于体重的统计描述(如平均数)由于较大幅度地增加了样本规模,不确定性会降低,但额外的抽样不会改变体重的自然变化。从理论上讲,如果我们完全可以测量场所的所有的小鼠体重,就不会有体重的均值不确定性(或关于小鼠体重的任何其他统计量),但体重变异性依然存在。
2.4.1.2 蒙特卡罗模拟
蒙特卡罗模拟或蒙特卡罗分析(MCA)是PRA中常用的一种概率技术。其又称统计模拟法、随机抽样技术,是一种随机模拟方法,以概率和数理统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。
蒙特卡罗方法是20世纪40年代美国在第二次世界大战中研制原子弹的“曼哈顿计划”的著名科学家S.M.乌拉姆和J.冯·诺伊曼首先提出来的。数学家冯·诺伊曼用驰名世界的赌城——摩纳哥的Monte Carlo来命名这种方法,为它蒙上了一层神秘色彩。在这之前,蒙特卡罗方法就已经存在。1777年,法国数学家蒲丰(Georges Louis Leclere de Buffon,1707—1788)提出投针实验的方法求圆周率π,这被认为是蒙特卡罗方法的起源。
蒙特卡罗模拟已广泛用于许多学科,如工程、商业和保险通过为风险方程中的输入变量(不一定是每个输入变量)确定它的概率分布,然后对概率分布进行重复抽样并使用这些抽样作为输入值来计算出一系列的风险值,从而描述风险评估中不确定性和变异性。风险评估的模拟输出是一个连续的概率分布,它能够以概率密度函数(PDF)或累积分布函数(CDF)表示。PDF和CDF是同一概率分布的不同表现形式,但是它们表达了不同的信息。风险的PDF表示不同风险值出现的概率,而风险的CDF通常是一个S形状,它表示小于或等于某一风险值的概率,并且它能为人们所关注风险水平相关的百分位提供明确信息。
MCA是一种概率技术,在风险方程中将计算机模拟技术与多种概率分布相结合,风险(Risk)方程可以表示为一个多重暴露变量(vi)和毒性参数(Toxicity)的函数:Risk=f(v1,v2,…,vn)×Toxicity。在简化的情况下,评估变量在统计上是独立的,即一个变量与其他任何变量没有关系。在这种情况下,电脑会按照该变量指定的PDF,以随机抽样方式给每个变量选择一个值(vi),然后计算相应的风险值。这个过程是反复多次进行(如10000次)。每次计算作为一个迭代过程,建立一个迭代系统,称为模拟。蒙特卡罗模拟的每一次迭代应代表一个可能的输入值(即暴露变量与毒性变量的组合)。然而,风险评估并不意味着对应于任何一个具体的人,以“个人”为代表的蒙特卡罗迭代都是虚拟的,以取得在一个特定的暴露人群或生态种群中风险发生的概率。模拟结果得到的一系列风险值,形成风险分布图。更为复杂的蒙特卡罗模拟,需要考虑输入变量的相关性,利用条件分布或相关系数进行分析。
目前还没有特定的标准确定PRA的“最低限度”的迭代次数,一般的经验法则是,在决策时需要有足够的迭代次数来获得稳定的输出百分位数值。数值稳定,是指随机变异性,或随机抽样的“摆动”能通过按照同一输入假设进行的多次模拟并计算出在指定输出百分位的平均变化来进行评估。举例来说,当以±1%作为标准应用于多次模拟时,5000个迭代足以使输出的第50百分位数值稳定,但对于第95百分位却不够。
2.4.2 阶层式概率评估程序
2.4.2.1 基本概念
阶层式评估是一个系统的过程,其中包括概率风险评估在内,是一种复杂程度不断增加的评估方法。阶层式评估的过程核心概念是评估工作、审议工作、收集数据、工作规划和通信交流的迭代过程。层次越高所表现的复杂程度越大,需要更多的时间和资源。层次高也反映出在风险评估中越来越多的变异性和不确定性特征,这对于制定风险管理决策是很重要的。
所有这些步骤应着重于:①在当前的状态下,风险评估是否足以支持风险管理决策(每一层都有可能做出退出阶层程序的决定);②若评估被认为是不充分的,是否要进行具有更大复杂性的下一层(或进一步完善当前层)。
所有风险评估,应该从问题描述、确定范围、编制一份工作计划以及收集数据这几方面开始。问题描述一般是一个迭代的过程,这是由于新的信息和数据的获得可能需要进行重新评估。项目管理者在进行任何风险评估活动之前应召开一次研讨会。根据具体的情况,在最初的这次研讨会议上讨论开展似然性概率风险评估可能是恰当的,或者在稍后阶段的阶层评估过程中进行这种讨论会更加富有成效。
在该过程中,风险管理者应在规划风险评估之前,着手与风险管理和其他利益相关者进行讨论。这种早期沟通可以帮助风险管理者评估目前的资料是否足够,并规划额外的数据收集活动。与公众和其他利益相关者进行的早期沟通,有利于信任的建立,并通过讨论协商一个恰当的备选方案。虽然概率风险评估可能涉及与环保界和外界的“专家”之间的技术交流,但是也应寻求在评估过程中的某个合适阶段与那些对备选方案有兴趣的普通民众之间的沟通。风险评估过程中,环保部门和利益相关者之间频繁和富有成效的沟通对于提高似然性概率风险评估成功率是必要的,也是十分重要的。
通常,一旦完成了对问题充分描述和工作计划,就可以开始对点估计风险评估进行数据收集工作。
2.4.2.2 阶层式概率评估方法
(1)第一层估计
第一层是对人类健康或生态环境的点估计风险评估。第一层风险评估的典型元素被列在表2-1中。决定风险评估的结果是否足以做出相应决策时,需要考虑的两个主要因素:一是风险估计与关注的风险程度的对比结果;二是风险估计的置信水平(Hill et al,2005)。
表2-1 第一层风险评估的典型元素(Hill et al,2005)
在第一层中,比较风险估计结果与关注的风险水平是相对较简单的,因为点估计风险评估的结果是风险的单值估计,只存在要么将超过、要么不超过关注的风险程度这两种结果。在第一层的风险估计中,计算评估的置信度是比较困难的,因为从一个点估计分析中常常不容易获得关于不确定性的定量方法。不确定因素产生于两个主要来源:①由于知识缺乏(数据空白)造成的对风险方程输入的不确定性;②点估计的精确度的不确定性,这主要来源于点估计的计算简化。
用来计算风险的输入值通常具有许多的不确定性来源。其中最常见的一个(但并不总是最重要的)是污染物浓度值的不确定性。这种不确定性通常通过计算暴露方程平均浓度的95%置信上限(95%UCL)来量化。风险方程中其他变量的不确定性(如吸收率、暴露频率和持续时间、毒性因子等)也可能是显著的,往往通过选择对风险更有可能被高估而不是被低估的输入来加以解决。通过讨论使用具体输入的误差方向与大小来定性这些不确定性来源。利益相关者能提供关于不确定变量和不确定性来源的有用资料。这是确保利益相关者有机会审查风险评估,并参与这一评估进程的一个重要原因。
①风险决策 如果风险管理者认为点估计风险评估的结果对于风险管理决策是充分的,风险管理者可以退出阶层式发展步骤,并完成补救调查或可行性研究过程。根据具体的结果,可能会做出以下两种决策之一:“不用采取进一步行动”或者“采取补救动作”。当对风险的估计结果明显低于要求的水平[例如,国家石油及有害物质污染应急计划(NCP)风险范围1E-04至1E-06]和风险评估中置信度很高的时候,可以得出“不用采取进一步行动”的决定。当超过国家标准或者当风险明显超过了要求的程度和风险估计中的置信度较低的时候,可以做出“采取补救行动”的决策。
如果点估计风险评估的结果对风险管理决策的制定不够充分(例如,当风险估计在国家石油及有害物质污染应急计划风险范围1E-04至1E-06之内和风险估计的置信度较低的时候),在这种情况下,风险管理者不应该退出阶层式发展步骤,应采取适当方法来增加置信度,使得管理决策更具有可靠性。这些方法可能包括讨论点估计的敏感性分析,找出数据之间的差距,与利益相关者进行沟通(例如,获取特定情况的资料),讨论进行概率风险评估的潜在价值(或更高层次的概率分析),工作规划,进一步收集额外的数据等。
②敏感性分析 敏感性分析可能是风险评估中最有价值的一部分。敏感性分析可以识别重要的变量和评估路径,这可能是做进一步分析和收集数据的目标。PRA的每一层中,敏感性分析提供的信息是不同的。在每一级都可以使用多种敏感性分析方法,使用不同方法得出的结果差异可能很大。关于敏感性分析的内容在此只做简单介绍。第一层中的敏感性分析通常会涉及比较简单的方法,并不会采用蒙特卡罗模拟这样复杂的分析方法。一个典型的做法是计算各个暴露途径对风险的点估计的相对贡献。一个更为复杂的方法是从输入变量取值范围中取值,并用这些取值(即低端估计和高端估计)计算相应的风险点估计。风险输出对输入变量的敏感性是通过计算敏感性比率来衡量的,即风险输出的百分比变化除以输入变量值百分比的变化,即相对变化率。
敏感性比率(SR),通常是对变量逐个进行分析,因为同时让多个变量发生变化会让点估计变得非常麻烦。由敏感性比率所提供的信息一般限于输入变量的点估计的取值范围较小。因为点估计的方法不会产生风险分布,所以敏感性比率不能提供关于输入变量对风险变化的相对贡献,甚至无法提供风险分布百分位的不确定性等方面的定量信息。此外,对于标准乘除形式的风险方程,敏感性比率在对风险方程中的暴露变量进行相对重要性排序时也显得比较困难。当存在其他的一些可用信息时,一种对敏感性比率的改善方法,就是敏感性分值,即将输入变量的敏感性比率用该变量的变异系数进行加权。总的来说,最翔实的敏感性分析需要涉及蒙特卡罗方法。敏感性分析方法潜在优缺点是决定在第二层中是否进行概率分析的重要原因。
一旦确定缺乏数据,就需要收集更多的数据,并根据新增数据进行新的点估计风险评估。正如任何数据采集工作一样,数据质量目标(DQO)进程应当遵循获取适于风险评估并充分支持补救措施的样本。然后,再对新的点估计风险评估进行审议和决策,判断其是否能够成为做出风险管理决策的依据。更多数据的收集也可以为进入第二层和开展似然性概率风险评估提供一个有说服力的理由。如果概率风险评估的结果影响到风险管理的决策,那么就可以开展概率分析评估工作。收集数据、计算点估计值、考虑概率风险评估的潜在价值这一过程要不断循环,直到有足够的数据可支持风险管理决策,或者由于资源的限制不能进行数据收集工作。例如,土壤摄取率数据的一些研究只局限于小样本量,尽管一个新的土壤摄取研究可以减少风险评估的不确定性,但是这一研究是昂贵的、费时的,而且难以操作。数据质量的不确定性不会成为退出第一层的原因。
由于样本太小,在选择概率分布时就存在不确定性。针对这一点,可以使用比较简单的概率分布,如三角分布或均匀分布也是可行的。这些简单的分布会对风险评估中的变异性分析带来方便,因此它们也应该包含在敏感性分析中。包括一个或一个以上的初步分布的蒙特卡罗模拟结果可能会导致几个不同的决策。如果敏感性分析表明风险估计对用概率分布描述的变量是相对不敏感的,那么与分布选择相关的不确定性不会影响使用阶层式方法的风险管理决策过程(例如,选择最大合理暴露百分位,获取初步整治目标)。但是,如果初步分布所描述的变量是风险估计中变异性或不确定性的重要来源,那么这个信息应体现在科学管理的决策上(Hill et al,2005)。在批准进行更多的数据收集工作的风险管理决策中,不确定性是十分重要的。反过来说,如果不确定性不能降低,那么退出阶层式过程则是必要的。虽然阶层式过程可能在这一点结束,但是它仍然可以为概率风险评估的结果提供有用的信息。举例来说,不确定性的信息可能会影响表征合理最大暴露风险的百分点的选择。此外,当似然性概率风险评估中的不确定性比较大的时候,着眼于重点估计分析的结果是比较恰当的。
如果想要知道点评估位于风险分布的什么位置,那么就要授权开展概率风险评估工作。这方面的一个例子是国家石油及有害物质污染应急计划(NCP)中的在1E-04到1E-06内(关注风险范围)的风险估计。如果能够证明风险的点估计位于风险分布相当高的位置,则该评估就足以支持风险管理决策。举例来说,如果点估计是在风险分布的第99百分位,并且合理最大暴露的风险范围中的较低百分位数是低于NCP的关注风险范围,以及风险结果具有较高置信度,那么就可以做出“不用采取进一步行动”的决策。这种类型的评估需要使用PRA这一技术。即使风险的合理最大暴露点估计超过了规定的风险关注水平,则不需要用PRA来确定这个结果,但源于PRA的信息仍然有益于制定实现保护性的初步整治目标的战略。
(2)第二层估计
风险评估的阶层式发展步骤的第二层一般包括一个简单的概率方法,例如一维蒙特卡罗分析(Bortz et al,1975)。一维蒙特卡罗分析是一项统计技术,它结合点估计与概率分布产生一个能够表征总体风险的变异性和不确定性的概率分布。第二层风险评估的典型元素见表2-2。虽然第二级评估大部分是用一维蒙特卡罗分析来表征风险评估中的变异性,但是有时也利用一维蒙特卡罗方法来描述风险评估中的不确定性。
表2-2 第二层风险评估的典型元素(Bortz et al,1975)
选定的输入变量的算术平均数或中位数(即第50百分位数)的不确定性的概率分布可以用一维蒙特卡罗分析通过产生一个中点趋势风险评估的不确定性的概率分布来详细描述。但是一维蒙特卡罗分析重点还是用来表征风险评估中的变异性。
(3)风险决策
一般情况下,当决定一维蒙特卡罗分析的结果对风险管理决策是否充分时,主要考虑的问题有三个(Chen et al,2001),它们分别是:①合理最大暴露的风险范围是什么,以及它同要求的水平的比较结果如何?②点估计风险位于风险分布的什么位置?③风险估计中的置信度水平是多少?
在第二层,同点估计方法相类似,单一的一维蒙特卡罗分析风险分布的置信水平以一种定性或半定量的形式表示。但是我们应避免形成这样的输入分布,因为概率风险评估模型不仅表征变异性,而且还描述了不确定性,将二者混合在同一个风险分布里,不利于二者的区分。第二层中,表征风险估计中不确定性的首选方法应该采用多重一维蒙特卡罗分析模拟(关于变异性),即用对一个或多个参数的不确定性进行不同的点估计,同时结合一个或多个变量的变异性的概率分布。更为先进的PRA技术,如二维蒙特卡罗分析,通过一个暴露模型对变异性和不确定性分开处理,这将在第三层中涉及。
如果第二层中的一维蒙特卡罗分析的风险评估结果能够充分地支持风险管理的决策,那么风险管理者就可以退出阶层式发展步骤,并完成补救调查和可行性研究过程。一维蒙特卡罗分析的结果可能支持“不用采取进一步行动”或“采取补救行动”的决定。当合理最大暴露风险范围(或在合理最大风险范围之内的指定点)明显低于所要求的水平和风险分布的置信度很高的时候,我们就会得出“不用进一步采取行动”的决定。当超过国家标准(例如,适用于地下水的最高污染物含量),或者当合理最大暴露的风险范围明显高于所要求的水平和风险分布的置信度较低的时候,可能就会做出进一步“采取补救行动”的决定。
如果风险评估的结果无法支持风险管理的决策,就存在以下几种情况:①合理最大暴露的风险范围接近于国家标准并且风险分布的置信度较低。在这样的情形下,风险管理者可能决定不退出阶层式发展步骤,而是继续采取适当措施,以增加风险估计的置信度。②不确定性高,有一个以上的变量对风险评估中的不确定性有重大影响。用一维蒙特卡罗分析模拟去暴露一个以上变量的不确定性是很困难的。③点估计风险评估的结果与一维蒙特卡罗分析的结果是显著不同的。虽然我们并不指望合理最大暴露风险估计与一维蒙特卡罗分析的结果相一致,但是通常合理最大暴露的点估计应与风险分布内的合理最大暴露范围内的百分位值(即从第90至第99.9百分位)相对应。如果合理最大暴露的点估计值不在这个范围内,我们将进一步评估输入变量相关内容的选择,包括输入变量的合理最大暴露点估计,一维蒙特卡罗模拟中输入变量的概率分布选择,以及分布中相关参数选择(其中还包括截断界限的选择)。
第二层和第三层之间的审议、决策步骤与第1级和第2级之间的决策步骤是相似的,包括讨论第2级各个输入变量的敏感性分析,进一步确定数据的缺失,以及与利益相关者的沟通(例如获取特定情况的资料),讨论用概率方法进行进一步分析的潜在价值,编排工作规划,以及收集更多数据等。与第1级的评估一样,收集更多数据的工作应遵循数据质量目标过程,应当用新的数据重新进行点估计风险评估。然后再对新的点估计风险评估进行审议和决策,判断其是否能够成为做出风险管理决策的依据。
在所有层次中都应该积极鼓励利益相关者的参与。一旦完成了针对变异性或不确定性的一维蒙特卡罗分析,就可用于审查和解释,那么就应当召开一个利益相关者会议。也应当为感兴趣的利益相关者提供机会去审核一维蒙特卡罗分析和提供建议。
除了确定缺乏哪些数据,还应该考虑改善一维蒙特卡罗模拟或更高级的PRA技术能够给风险决策过程带来什么样的好处。如果在概率风险评估讨论期间,能够确定更高级的似然性概率风险评估可能会影响风险管理决策,那么就可能会批准利用更高级的概率风险评估。如果已经收集到更多的数据,那么能够进一步精确点估计和一维蒙特卡罗分析。具体而言,如果高级的概率风险评估技术能够同时表征一个以上的变量的不确定性,就应该授权开展高级的概率评估工作。二维蒙特卡罗分析能在多变量和多参数估计中同时表征可变性和不确定性。在做出是否采用这类高级的概率风险评估技术时,应该同时考虑资源限制和降低给定变量不确定性的可行性。
(4)第三层估计
风险评估阶层式发展步骤的第三层包括更为高级的似然性概率风险评估方法,如二维蒙特卡罗分析、微暴露事件分析(MEE)(Grzywacz et al,2004)、浓度数据的地质统计分析和贝叶斯统计等。第三层风险评估的典型元素见表2-3。和其他级别一样,第三层包含一个讨论和决策制定的循环过程,在这个过程中分析的难度和复杂程度不断增加,直至分析的范围满足决策制定的需要。鼓励利益相关者的参与也是第三层次的重要步骤。
表2-3 第三层风险评估的典型元素(Grzywacz et al,2004)
一般情况下,第三层审议、决定循环中的各种要素同第一层和第二层中的环节是一样的。风险管理者必须确定高级概率风险评估的结果对风险管理决策来说是否充分,这与确定第一层的点估计风险结果和第二层的一维蒙特卡罗分析结果时所考虑的问题是相似的,并评估不确定性的来源、规模和范围。如果结果对风险管理决策是充分的,那么风险管理者就可以退出阶层式发展步骤,并完成相应的补充调查和可行性研究的过程。如果风险评估结果对于风险管理决策是不够充分的,那么就应查明缺乏的数据,而且如果已经收集了更多的数据,对于风险评估的各个阶段,包括高级概率风险评估、一维蒙特卡罗分析和点估计风险评估应加以完善。总体而言,继续在第三层做进一步分析直到足以满足制定风险管理决策条件为止。
①确定评估层级 第一、第二和第三层的具体分析工具的分配往往会对具体评估都不适用(Hutton et al,2006)。在完成第一层和第二层之间的审议阶段之后,结论可能是第三层中的分析工具是适用的,而且对于决策制定问题是有益的。举例来说,空间建模对于改进关于暴露点浓度的不确定性的估计是有利的,甚至对于进一步减少不确定性而设计的区域抽样计划而言可能是有利的。然后一种改进的具有95%置信上限的地理空间分析估计(第三层的分析工具)将被集成到第二层加以评估,或平均浓度的不确定性的完全分布可能会被纳入到第三层的二维蒙特卡罗分析中。灵活地确定某个层的分析的复杂程度,有利于处理将会遇到的各种各样的风险评估问题。使用阶层式评估方法的一个重要的好处是,在复杂度水平不断提高的情况下,确保在评估之前进行相关的讨论,这一过程不可或缺。与生硬地为某一层指定一套分析工具相比,协商过程更为重要,当然要记录整个协商的过程。
②不确定性与变异性分析
a.变异性描述
(2-7)
式中,I为日摄入量;C为污染物浓度;CR为接触率(通过摄入、吸入、皮肤接触的方式);EF为暴露频率;ED为暴露时间;BW为体重;AT为平均时间。
在PRA中(Freudenburg,1988),唯一的区别是概率分布能细分为一个或多个变量,而不是单一值。通过重复选取随机值和计算相应的风险,得以实施蒙特卡罗模拟。对大部分PRA而言,概率分布将用于描述个体间的变异性,这种变异性指的是人种间真正的差异性或多样性。因此,例如每日摄入量的变异性能通过结合暴露中变异性的多种来源(如摄入率、暴露频率、暴露持续时间和体重)来描述。在风险评估中还可能考虑化学物质浓度的变异性和生态风险评估中毒性期限等。
b.不确定性描述 可将不确定性描述为对影响暴露或风险因子缺乏相应的了解。有些评估受规章制度限制,希望风险评估者将试验性的数据转化为对人类健康有不良影响的概率分布,这是不确定性的有用证据。来源于样本或可替代总体的数据被用来确定特定目标人群的暴露评估和风险评估,这一推断要求假设存在固定的浓度和局限性,同时风险评估结果可能会因此而出现偏差。例如,对致癌物质,风险评估中的一个共同的假设是危害废弃物所界限范围内污染物浓度表示的是受体暴露于整个暴露阶段的浓度,它与整个生命过程的剂量平均值一致。假如在整个暴露持续期间,受体均暴露于危害的情况是不可能出现的,这个假设将是保守的估计(即导致过高暴露估计)。评估人员应该清楚地知道风险评估中假设的合理性及它的影响性和局限性,这是风险评估者不容推卸的责任。
在美国环保署准则中,包括暴露评估准则(U.S.EPA,1992a)、暴露因子手册(U.S.EPA,1997a,b,c)和蒙特卡罗分析指南(U.S.EPA,1997d),已经将暴露评估中的不确定性分成了三大类:一是参数的不确定性——该不确定值用于估计模型变量;二是模型的不确定性——模型结构(例如,暴露方程式)或有意使用的不确定性;三是方案的不确定性——由于缺失或不完全信息来定义暴露导致的不确定性。
2.4.3 概率分布与拟合数据选择
2.4.3.1 总体与抽样
总体包括目标总体和抽样总体。目标总体是指“关注群体”。风险评估者往往有意量化群体的特有属性(如暴露时间、暴露频率等)。抽样总体,是可选择和测量的受体群体,被用来代表目标总体。统计学总体是基于从抽样总体获得的信息得到的一个近似的目标总体(沃瑟曼,2008)。
用从具有代表性的抽样总体得来的分布来推断目标总体。理想的情况下,抽样总体应该是目标总体的一个子集,被选定用来测量,从而提供被研究的暴露因子准确和代表性的信息。然而,确定代表性样本也是需要说明和解释。
2.4.3.2 代表性数据
理解什么是代表性数据对于数据的选择和拟合分布是非常重要的。很多因素可以影响到代表性(例如样本量、选择目标总体和抽样总体的方法),这些因素对点估计和PRA都有影响。环境保护署关于风险评估中数据使用指南(U.S.EPA,1992)的A部分描述了在风险评估中,数据具有对人类健康和环境的真正风险方面的代表性。然而评价数据的代表性却很难,尤其在没有清楚地了解所要研究的问题和目标的情况下。评估的复杂水平不同,样本代表性的重要程度也不相同。为了研究目标总体,我们对抽样总体进行研究,该抽样总体与目标总体相似,但并不是目标总体的子集。当使用替代数据时,风险评估者应该判断数据对于目标总体的代表性。例如,来自两组独立样本(来自于同样的生态环境)的鹿鼠的体重分布会有不同,这主要是年龄结构、雄雌鹿鼠比例以及获取样本时间的不同所致。当不能确定样本数据的潜在概率分布类型时,可以对多种概率分布类型逐个进行风险计算,然后比较它们的结果。这种方法对于不确定性分析是一种简单而有效的方法。作为一个基本要求,应该在评估中讨论使用替代研究所带来的不确定性。
在许多情况下,抽样样本与目标样本有同样的属性,但这并不意味着其具有代表性。风险评估者应该确定它们之间的差异以及是否能够做出调整以减小这些差异。有很多种方法都可以根据可用的信息来估计这些差异。汇总抽样总体的统计数据可以用来估计目标群体的线性特征。例如,如果已知样本的均值、标准差以及不同的百分位,那么超过一个固定阈值的均值或比例就可以通过简单的加权平均求得。如果风险评估者有原始数据,那么调整的方法有很多。对于原始数据的调整包括加权平均、加权比例、变换以及建立在可用信息基础上的数据分组(例如,经验数据和专业判断)。
在大多数情况下,数据代表性的评估一定会涉及判断。整个工作计划一般应该包括数据描述,选择每个分布的基础以及参数估计的方法。一般情况,经验数据(例如观测值)可用来选择分布和取得参数估计。然而,在可用数据的数量和质量不能得到满足的情况下,可能会需要专家的判断。
2.4.3.3 专家判断
专家判断是指某个或某组专家在其研究领域所给出的推论性建议。当存在与输入变量有关的不确定性时,比如数据缺乏,这时专家的判断对获得分布是一个很合适的参考。需要注意的是,从专家那里所得到分布反应的是个人或一组人的推断,而不是经验证据。在决策分析框架中以专家判断为基础而得到的分布其作用与先验贝叶斯一样。当新的经验数据可用时,分布和先验贝叶斯可以进行修改。关于产生专家判断的操作原则和使用该结果支持决策的原则有很丰富的文献作参考。专家建议已经在被用于在风险估计(Morgan and Henrion,1990;Hora,1992;U.S.EPA,1997b)和确定空气质量标准(U.S.EPA,1982)中得到分布。
贝叶斯分析是一种统计方式,它允许当前的状态(以概率分布方式表示)与新的数据相融合以得到最新的信息状态。在PRA中,贝叶斯蒙特卡罗分析(Bayesian MCA)可以被用来确定新数据使不确定性的程度进一步减少。当与决策分析技术相结合时,贝叶斯MCA能够帮助我们判断减少不确定性所需要的数据种类和数量。在PRA中应用专家建议、贝叶斯统计、贝叶斯MCA和决策分析。
2.4.4 概率分布函数
在PRA中,概率分布是可以用来表征变异(PDFv)或不确定性(PDFu)。使用概率分布的一个优点是它们以一种紧凑的方式呈现出大量数据值(McDonald et al,2000)。例如,对数正态分布就是对1到11岁儿童的自来水摄入率(n=5600)(Roseberry and Burmaster,1992)这一大量数据集的一个很好的拟合。因此,分布类型(对数正态的)及相关参数(均值和标准差)充分说明了摄入率的变异性(PDFv),从而可以计算出其他有用的统计量(如中位数,第95百分位)。简化复杂暴露模型和良好的拟合分布,可以促进定量分析和交流建模方法。PDFu可用来表征参数的不确定性。例如,由于测量误差、样本量小以及其他关于样本代表性的问题,样本均值就是总体均值(μ)的不确定的估计。对于一个真实存在但是未知的参数,可以通过一个概率分布来表征它的所有可能的取值。理解变异性和不确定性可以通过一个PDF来表征,对决定在PRA中如何指定和使用该分布和其参数是很关键的。
2.4.4.1 概率密度函数与累积分布函数
提到概率分布,必须要提到的一个概念就是随机变量。随机变量是一个变量,其可以从一组偶然值中假设任意值。离散型随机变量仅可以假设为有限的或可数的多个数值(例如,一年的降雨次数),但如果取值为一个区间内的任何数据,则随机值是连续的(例如,一年中的降水量),该变量就是连续随机变量(Carreras et al,1999)。
概率密度函数(PDF),也称为概率模型,是概率分布的一个常用术语,它表示变量在其取值范围内每一个值的概率,它被用来表征连续型随机变量X。例如,在普通美国人群中自来水摄入(mL/d)分布规律,大致为对数平均值6.86和对数标准差为0.575的对数正态分布(Cunha et al,1998)。
可以通过蒙特卡罗模拟变量,从而得到变量的概率密度函数的形状分布。密度来源于一个点X的概率的概念,对于一个连续分布而言,就等于在与X值附近的一个狭窄范围内的概率密度模型曲线下的面积。
概率分布函数是指随机变量X小于或等于某个值的概率P(X≤x),即F(x)=P(X≤x),即所有小于或等于x的值出现概率的和。对于连续随机变量而言,它的概率分布函数被称为累积分布函数(CDF),是其概率密度函数的积分。对于离散型随机变量(如抛骰子或掷硬币)而言,它的概率分布函数被称为概率群分布函数(PMF)。PDF和PMF的主要特点是,描述了一个变量可取的数值范围,并标明每一个值在该范围内出现的相对可能性(即概率)。
PDF作为蒙特卡罗分析的基础,是进行一次有目的分析必不可缺的部分。PDF可以采取各种各样的形式。一些理论性PDF例子包括正态、对数、指数、均匀、二项式分布,这些形式都具有自己的特点。在蒙特卡罗分析应用中,选定一个模型中每个输入变量的PDF,对输出值是非常关键的。PDF的形式可能极大地影响蒙特卡罗分析的结果,所以必须慎重选择,因为选择不适当的PDF可能会导致不正确的结论。
2.4.4.2 经验分布函数与参数分布函数
在某些情况下,与调整数据集使其符合一个预先假定的分布相比,经验分布函数显得更好一些。经验分布函数(EDF)也叫做经验累积分布函数(ECDF),它提供了一种使用数据本身来确定变量分布的方法。简单地说,一个随机变量的经验分布函数就是一个阶梯函数,该阶梯函数是基于该随机变量观测值的频率直方图得来的。连续随机变量的经验分布函数是通过对频率分布中不同水平区间插值而变成曲线(该线性是表示连续不间断的意思)。插值后的频率分布的累计分布函数(CDF)就是一条曲线,而不是呈阶梯式的(Skaug and Tj?stheim,1993)。
经验分布函数代表了所有的数据,没有丢失任何信息。经验分布函数不依赖于理论概率分布中参数估计的假设,它提供有关分布形状的直接信息,这些信息包括数据集的偏斜、多峰性以及其他特性。然而,经验分布函数由于数据获取的限制,并不能充分描述实际分布的尾部。简单地理解,经验分布函数就是数据集的极限。如果限制经验分布函数所用样本的最小值或最大值,就可能大大地低估实际分布的尾部。如果这是不确定性的一个重要来源,风险评估者应该选择延长经验分布的尾部到一个合理的界限或是用另一种分布描述尾部,如下:
线性化:在两个观察值之间出插值,就会得到一个线性化的累积分布函数。
对延伸:除了线性化(见上面),基于经验判断,添加下限和上限。
结合指数分布:添加一个指数分布到EDF的尾部(低端或高端)。
例如,基于最后5%的数据可以用一个指数分布来延长尾部。这种方法是以极值理论,以及许多连续无界的分布的极端值都服从一个指数分布这一结论为基础的。和其他概率模型一样,可以通过获得额外的信息来减少具有假定界限的经验分布的不确定性。
2.4.5 概率分布函数拟合数据
当获得足够关于输入变量的相关数据时,我们可以根据这些数据来拟合输入变量的概率分布。然而,为所有的输入变量拟合概率分布,是资源密集的,所以一般是不必要的。在理想的情况下,确定一个变量子集,这个子集是风险估计中的变异性和不确定性的重要来源。而敏感性分析可以用于确定主要的暴露途径和暴露变量,并同时对它们进行等级排序(Acuna et al,2012)。但是,从敏感性分析中获得的资料可能是不同的,这要取决于所使用的敏感性分析方法和有关输入变量的相关资料,所以风险评估人员需要了解每一种敏感性分析方法所具有的局限性。
有时不止一个概率分布可以描述变异性和不确定性。分布的选择应以可用数据为基础,并要考虑产生变异性的机制或过程。一般说来,首先要考虑的是能充分描述变异性或不确定性,与数据的产生机制相一致的最简单的概率分布。例如,不一定因为在使用拟合测试软件包测试之后,对数常态分布(lognormal distribution)比一个含两参数的对数正态分布有更高的排名而必须选择对数常态分布。
选择分布需要考虑是否存在选择分布的原理?分布的形状会受到物理或生物特征或其他机制的影响吗?变量是离散还是连续的?变量的界限是什么?分布是否是对称的?是否知道有关分布形状的其他信息?分布的尾部对观测样本的代表性如何?等等。其第一步是判断随机变量是离散的还是连续的。连续变量可以取一个或多个区间的任何值,并且一般表示测量值(如身高、体重、浓度)。对于连续变量概率密度函数一般描述一个区间上的每个值的概率。离散变量可以取有限的或可数的多个(与整数集中的元素个数一样多)的一系列数值。每一个离散值被赋予唯一的概率。一个月中降雨发生的次数就是一个离散变量,而降雨量却是一个连续变量。同样每个月吃鱼的次数是离散的,而平均每次吃的鱼量却是连续变量。另一个需要考虑的因素是对于一个变量是否有合理范围。例如,一个美国人体重小于30kg或大于180kg都是不太可能的。多数暴露变量在合理范围内都假设为非负值。因此,分布大都在零处进行最小值截断(或更高),或者指定一个具有理论非零值范围的概率分布。
2.4.5.1 分布拟合时考虑变异性与不确定性
用来描述一个变量变异性与不确定性的概率分布不止一个。例如,一个正态分布可以被用来描述体重的变异性,一个均匀分布可以被用来描述该正态分布均值这一参数的不确定性。变异性一般是指观察值的差异,这些差异是源自于一个总体中个体的异质性和多样性。个体间的变异性产生于环境、生活方式和遗传基因的不同。例如,个体间的生理差异(如体重、身高、呼吸率、饮水的摄入率等方面的差异)、环境差异、土壤类型的不同以及环境中污染物浓度程度的不同。个体内的变异性表现在随年龄变化而产生的差异(例如,体重和身高)。变异性通过进一步的测量或研究是不会减少的。表征变异性的概率分布函数(PDF)可以通过对样本观察进行拟合得到(Limpert et al,2001;Wilheit et al,1991)。
2.4.5.2 不确定性来源
不确定性一般是指对某个具体因素、参数或模型等缺乏了解。由于我们在研究过程对现实世界进行了必要的简化,风险评估中存在不确定性是不可避免的,但是它可以通过进一步的测量和研究而降低。参数不确定性部分来源于测量误差、样本误差或其他在数据采集过程中的系统误差。模型不确定性来源于对复杂过程的简化、模型结构的错误构造或错误地应用模型、使用错误的概率分布以及使用替代的数据或变量。场景不确定性可以用来反映一个暴露模型的不确定性,例如目标群体的暴露途径。
风险评估中通常有很多的不确定性来源,其中最熟悉的一个(但并不见得最重要的)是污染物浓度值的不确定性。在风险方程中,浓度一般用平均浓度95%置信上限来表征,这就为风险评估带来了不确定性。风险方程中其他变量的不确定性(如摄入率、暴露频率和暴露时间、毒性因子等)也可能是显著的,所以一般选择对风险可能被高估的输入值而不是低估的输入值。利益相关者可能会提供不确定性来源的有用材料,所以应该确保利益相关者有机会参与审查风险的评估过程。
暴露模型可以指定不确定性事物的概率分布。例如风险估计中的浓度通常是指一个受体长期的平均浓度,该浓度的不确定性的概率分布可以在一定程度上是基于小样本长期平均估计的统计不确定性,以及对指定暴露单元受体的随机运动而产生的统计不确定性。
2.4.5.3 概率分布与模型不确定性
概率分布在某种意义上也可以看作是一种模型,这个模型是对样本数据或经验的变异性或不确定性的近似表示。模型更为广义的意义是用来表征一个化学、物理或生物过程。在风险估计中,可以找到不同的风险模型,这些模型有着不同的对象、专业定义、不同的组件和理论基础。
所有的模型都是对复杂的生物和物理过程的简化描述,模型可能排除重要变量或暴露的重要途径,忽略输入量间的联系,使用替换变量,或者模型是为特殊场景设定的。这样就使得模型不可能充分表征它所要评估的现象的各个方面,它也不适合另一个不同类型场景的风险评估。例如,针对污染物的连续稳定的暴露进行风险评估的模型,可能就不合适或不能用于评估急性的或慢性的暴露事件的风险。在任一风险评估中,弄清楚模型的最初目的,模型中所做的假设,模型中的参数代表什么,以及它们如何相互影响,都是非常重要的。根据这些知识,我们可以清楚地了解,在特定场景中运用此模型的代表性和适用性。假设多重模型存在,且能用于给定的方案中,为了解差异间的潜在含义,对其结果进行比较是非常有用的。针对不同的场景,运用不同的模型或是改变模型的复杂水平,能为风险评估中的不确定性提供有用的信息,而这些不确定性来源是场景的不确定性或模型不确定性。搜集一个给定的参数或与模型输出相关的可测数据(比如搜集蔬菜和水果污染数据作为模型中植物摄入量),可以减少或至少更好地理解模型与场景的不确定性。
2.4.5.4 概率分布与参数不确定性
在概率模型中量化参数的不确定性一般需要进行判断。例如,小样本量和问题样本,都会导致不确定性。蒙特卡罗模拟是风险评估不确定性的一个有用的工具。当不能确定敏感的输入变量时,模拟不确定性是非常重要的。可以使用点估计法(例如,一系列中心趋势暴露可能值)或概率方法(例如,分布算术均值的一系列可能值)来量化不确定性。然而不确定性分析可能使风险管理决策变得复杂,这是由于风险估计是高度不确定的,但这些信息可以促使我们收集数据以减少敏感输入变量的不确定性。同样,当量化了风险模型中具有高度不确定性的输入变量后,风险估计的结果仍然在监测水平之下,风险管理者就可能在做出决策时更有信心。风险评估者应该避免在同一个蒙特卡罗模拟中将所有备选的不同分布设定特殊的概率。相反,建议在探究模型或参数不确定性时对不同的备选模型使用单独的模拟。例如,与其在模拟的每次迭代中为暴露变量随机指定β分布或指数正态分布,不如对备选概率分布进行单独的模拟。同样的,如果量化的风险具有多个时间或空间尺度,我们也需要考虑多个模拟。
参数不确定性最容易被认为是不确定性的来源,这种不确定性在危害废弃物场所的定点危害评估中能被量化。参数不确定性可能发生在风险评估过程中的每个环节,从数据搜集和评估到暴露和毒性评估的每一步。参数不确定性来源可能包括系统误差,或是在样本数据采集过程中出现的偏差,不精确的分析测量,替代重要参数的外推法等。例如,土壤数据的搜集只来源于最高污染的区域,而不是受体可能会接触的全部区域,这样将会导致暴露评估出现偏差。
参数估计的不确定性可以用不同的方法进行描述。正如用于描述变异性的概率分布函数一样,参数不确定性可以用带有参数的概率分布函数来描述。有时不确定性的分布可以通过已知(或假设)的可用于描述变异性的概率分布来指定(Marx and Larsen,2006)。例如,如果X是正态随机变量,t分布和卡方分布(χ2)就可以分别描述由于随机测量误差引起样本均值和方差的不确定性。t分布和卡方分布(χ2)的不确定性(PDFu)是由样本量n来决定。如果不确定性不能用一个PDF来描述或有关描述变异性分布的假设不成立,我们就要考虑采用非参数或“自由分布”方法(如bootstrapping)。参数方法与非参数方法都会产生总体参数估计的置信区间。
一般来说,参数的不确定性在PRA的每一层都能被量化,包括点评估分析(第一层)、一维蒙特卡罗分析(第二层)和二维蒙特卡罗分析(第三层)。在点评估方法中,对大多数变量而言,参数不确定性可以用一种定性的方式来表征。例如,有关点评估的风险评估文件中不确定性部分可能规定了吸收分值100%将被用于表示胃肠道吸收的土壤污染物的总量,这样就会导致风险评估可能高于实际的风险。此外,可实施敏感性分析,即改变一个输入的变量并保持其他变量不变,检测出它对风险结果的影响。对于胃肠道吸收这种情况,对吸收分值这一变量,其可能不同的高端或RME点估计值均可作为风险方程的输入值,它们对应的不同的风险评估就能反映出吸收分值RME点估计的不确定性。
2.4.5.5 参数估计方法
对于给定参数的估计,通常有多种不同的方法可供选择。应用中要根据所采用方法的相对难度以及所满足的统计标准选择合适的方法。最大似然估计(MLE)是一种常用的方法,被认为是一种基于观测样本最佳的参数估计。最大似然估计值是符合连贯性、有效性、健壮性、充分性和无偏性这一系列标准的。在一些情况下(比如小样本时),这些估计值不是无偏的;然而,这通常可以通过调整来补偿。一个有关这种调整的常见的例子是正态分布的方差估计。用样本方差来估计总体方差属于有偏估计,但是将样本方差乘以因数n/(n-1)就可得到总体方差的无偏估计。对于一些分布,计算最大似然估计是很直接的(Scholz,1985)。
2.4.5.6 如何处理参数或变量之间的相关性
暴露变量间相关性或概率分布参数间的相关性是概率模型的重要组成部分。相关性用于衡量两个随机变量间联系的紧密程度(Bound et al,1995)。两个随机变量既可能是正相关,也可能是负相关。两个变量中,如果X1值随着X2值增大而增大,则呈正相关性。例如,儿童血液中铅浓度随着微尘中铅含量升高而升高。两个变量中,如果X1值随着X2值减小而增大,则呈负相关性。例如,研究表明,土壤尘埃粒子的摄入率随着粒子的增大而减少。有一点需要注意的是,相关性描述的是变量间数量相关程度,而不是变量间的因果关系。
鉴别相关性的第一步是评估变量之间可能存在的物理的和统计的关系。相关性影响一个风险模型输出的程度取决于:①两个变量之间相关性强度;②相关性变量对输出变化的影响。因此,不妨进行初步敏感性分析评估相关的假设对模型输出的影响。如果影响显著,这种相关性应在PRA进行确定和计算。
在蒙特卡罗模拟中寻找相关性的步骤包括:①修改模型使其考虑到相关性;②在生成样本中模拟变量间的相关性。修改模型是首选的途径,因为模拟技术不能完整地反映模型输入之间的复杂度。然而,当不可能修改模型时,变量之间的相关性可以通过相关系数和二元正态分布近似。
相关系数是一个度量两个向量(具有大小和方向)间关系的数值工具。样品相关系数可以用来度量变量间的线性关系。可是,如果两个变量来自不同概率的分布,不太可能具有线性关系。Spearman相关系数又称为秩相关系数,使利用两变量的秩次大小作线性相关分析,对原始变量的分布不做要求,属于非参数统计方法。因此它的适用范围比Pearson相关系数要广得多。即使原始数据是等级资料也可以计算Spearman相关系数。对于服从Pearson相关系数的数据也可以计算Spearman相关系数,但统计效能比Pearson相关系数要低一些(不容易检测出两者事实上存在的相关关系)。
概率分布中的参数也可能存在相关性。在设计一个二维蒙特卡罗模拟时,我们常常对同一个PDFv's中的参数用独立不相关的PDFu's表征。针对这种情况,一个常用的方法是为两个相关参数指定一个二元正态分布。一个二元正态分布允许一个变量在另一个变量条件下进行取样。这是联合分布的一个特例,其中x和y是两个随机变量,并且是正态分布(因为在x或y的条件下分布是正态分布)。
应谨慎对待相关性分析的结果,两个变量出现相关性有以下几种原因:①两个变量相互依存;②偶然性(由于在取样过程中的两个独立变量偶然出现相关);③分析中未涉及的变量(潜在变量)影响了分析的两个变量。同样,一个相关性低的结果也不能说明两个变量是独立的,因为可能存在一个潜在变量隐藏了两个相关变量间的相关性。另外,还应谨慎地对待相关性的推广。例如,孩子们的年龄和体重之间可能有很强的线性关系。然而,这个相关性用在成人中却是不恰当的。另外需要注意的是在同一时间内两个因素以上的相关性。一般而言,因为当在同一时间内关联两个以上的因素时,这就需要指定一个有效的协方差矩阵,但是这往往具有一定的复杂性,所以风险评估者需要去咨询统计学家,从而避免产生错误的风险估计。
2.4.5.7 截断与截断数据
截断就是对一个概率分布强加一个最小或最大值,截断的主要目的是将样品空间限制在一组“合理的值”之内。例如,将一个成人体重的概率分布截断,使其在最小值为30kg和最大值180kg之间,以避免出现偶然性的不可能值(如5kg或500kg)(Lee and Desu,1972)。在选择截断界限时具有主观性,所以进行选择时应该非常谨慎,并需要指定地点、环境及利益相关者的了解和参与。举例来说,有可能有的人体重超过180kg或低于30kg。截断分布曲线的尾部的目的是为蒙特卡罗模拟的每次风险评估限制一组合理的输入值。在PRA中,截断无界概率分布的好处是,集中趋势和高端的风险评估不会出现不切实际的偏移值。缺点是由于限制了样本空间,未截断分布的原有参数估计发生了改变。参数评估的偏移随最大、最小截断限值间隔的减小而增大。例如,均值为100的正态分布,可以拟合一个数据集;采用300的截断界限可能会导致被截去顶部的正态分布的均值变成85。截断与不截断的参数估计之间的关系,可以通过对这两种情况进行蒙特卡罗模拟来做进一步决定。
当使用无界概率分布(比如正态分布、对数正态分布、γ分布、威布尔分布)描述变异性时,通常会考虑截断(Fishburn,1980)。在为暴露变量确定“合理范围”合适的截断限制时,需要做进一步的判定。鉴于大部分的数据集代表的是目标总体中的统计样本,观察到的最小值及最大值并不能代表总体的真实最小和最大值。然而,生理或物理因素可能会有助于确定合理的截断限值。例如,在胃肠道(消化道)中化学物的最大生物利用率是100%。同理,化学药品在水合环境中的可溶性(考虑了温度影响)一般都将低于其在自由水中的溶解性。
一般而言,敏感性分析可以确定截断界限在风险估计中是否是参数不确定性的一个很重要的来源。对于风险方程中分子的暴露变量,其最大截断限值应给予极大关注。对于风险方程分母中的暴露变量,其最小截断限值应给予极大关注。关于拟合概率分布尾部的详细资料和截断在参数估计中的影响应该列入工作规划中。
2.4.6 食品加工过程混合危害物暴露评估
2.4.6.1 总体评估框架
一般而言,对于食品加工过程混合危害暴露评估首先应根据数据性质、数量以及评估目的需求等决定是开展综合毒性明确条件下的评估还是开展混合化学物中单一毒性均明确条件下的评估。前者同评价单一污染物风险方法类似,仅考虑混合化学物中关注的化学物,关注类似或其他已知与混合化学物类似的化学物的情况来评价。后者是真正意义上复合风险评估,而目前对复合风险评估方法研究也重点关注于此,本文也主要介绍基于混合污染物中各单一化学物毒性作用方式及其毒性数据可获取情况下的风险评估方法。
混合化学物根据其与机体作用方式和效应等可分为相似作用、非相似作用、部分相似作用、相互作用和依赖作用,如图2-5所示(Boobis et al,2011)。
图2-5 混合化学物复合风险评估决策框架(Boobis et al,2011)
①相似作用:也叫浓度加和(concentration addition,CA)模式或剂量加和(dose addition,DA)模式,混合物体系中不同化学物对机体作用靶器官、毒性效应均相同,相互之间不影响其活性,其共同毒性相当于被不同化学物共同稀释,毒性取决于化学物毒性当量(TU)。危害指数(hazard index,HI)法、毒性当量因子(toxicity equivalency factor,TEF)法、相对效能因子(relative potency factor,RPF)法、终点指数(point of departure index,PODI)法、暴露边界(margin of exposure,MOE)法以及累积风险指数(cumulative risk index,CRI)法等均属于该范畴内。
②非相似作用:也叫效应加和(independent action,IA)模式,不同化学物对机体作用靶器官及作用基团、配体或位点不同,但毒性效应相同。采用IA模型评价方法。
③部分相似作用:该作用介于相似和非相似作用之间,是两者皆有的模式。应用二步预测(two steps prediction,TSP)建模,该方法既考虑了CA模式,又考虑了IA模式所组成的化学物混合体毒性评价。适用方法有综合相加模型(integrated addition model,IAM)。
④相互作用:相互作用指化学物之间存在的协同、拮抗、增毒和减毒等联合毒性效应,相互作用发生于浓度修饰或效应修饰,当导致有效浓度改变,则产生浓度相互作用。适用方法主要是剂量和效应相加综合模式(integrated addition and interaction,IAI)建模、生理毒代动力学(PBPK/PD)建模、QSAR建模、物种敏感度分布及动态能量测算(DEBTOX)等。上述方法尚未能很好应用于具有相互作用混合污染物的复合风险评估中,主要原因是由于应用这些方法需要相对连续和准确的原始数据,同时为满足不同风险评估目的,数据量需求相对非常庞大。
⑤依赖作用:化学物对机体作用方式、途径以及靶器官等各不相同,且相互有影响,则为依赖作用。
2.4.6.2 混合化学物复合风险评估技术及应用
(1)相似作用模式下建模方法
对于CA模式,二元混合和多元混合化学物毒性效应可分别通过公式(2-8)和公式(2-9)表达(Kim et al,2010)。
(2-8)
(2-9)
式中,Ei是化学物i在混合物中有效浓度水平;ECxi表示化学物i导致x效应的浓度水平,表示多种混合化学物产生的毒性水平;TU表示毒性单位,是混合化学物导致某效应的毒性当量;pi为化学物i在混合污染物体系中自身的浓度水平。
如TU=1时,则混合物之间呈现相加作用,即CA模式效应,相当于二元混合化学物产生一个单位的毒性当量;如TU<1,混合物之间呈现协同作用,即混合化学物不需要达到一个单位毒性当量的综合浓度,即可达到一个单位毒性当量效应;如TU>1时,混合物拮抗作用,如TU0表示标准毒性当量,当TU=TU0,则呈现独立作用。
目前针对CA模式开展人体健康评估是累积性风险评估(cumulative risk assessment),其主流方法有HI法[公式(2-10)]、CRI法[公式(2-11)]、PODI法[公式(2-12)]、MOE法[公式(2-13)]、RPF法[公式(2-14)]和TEF法[公式(2-15)]等。
(2-10)
式中,HI表示危害指数;Ei表示化学物i在混合物中有效浓度水平;ALPi表示适当保护水平,该保护水平可以是ADI、急性参考剂量(ARfD)、TI等人体健康毒性阈值水平。
(2-11)
式中,CRI表示累积风险指数,其结果为HI的倒数。
(2-12)
式中,PODI表示终点指数,PODi可以以BMD或NOAEL替代,也即是PODI方法未考虑不确定系数UF和MF,直接为动物毒性阈值水平,而HI方法直接表征人体健康阈值水平。
(2-13)
式中,MOE表示总暴露边界,其结果为终点指数的倒数。
(2-14)
式中,RPF表示总相对效能因子;Ei表示化学物有效浓度水平;RPFi表示化学物i的相对效能因子。
PRF法是当前美国环境保护署(EPA)和欧盟食品安全局(EFSA)等机构在开展食用农产品中具有共同毒性效应机制农药累积性风险主推的技术方法。
(2-15)
式中,TEQ表示总毒性当量;TEFi表示化学物i的毒性当量因子。
TEF法与RPF方法基本一致。
上述模型可见,其建模原理几乎一致,相对初级的方法为HI法,该方法简单易懂,数据易得,是对单一污染物HI的简单加和,既未考虑联合毒性的累积性效应,也未考虑毒性效应终点(point of departure,POD)(主要包括ADI、ARfD或BMD)外推过程中的不确定性(uncertainty factors,UF),因此实际上并不能最真实地反映累积性膳食风险。TEF法和RPF法属于同一系列,该方法考虑了毒性当量,并利用基准物的毒性当量进行加权求和来进行风险评估,反映了毒性当量以及累积性评估概念。
(2)非相似作用模式下建模方法
对于IA模式,二元混合和多元混合化学物毒性效应可分别通过公式(2-16)和公式(2-17)表达和判定。
E(Cmix)=E(C1)+E(C2)-E(C1)×E(C2) (2-16)
(2-17)
式中,E(Ci)表示混合物中化学物i有效浓度水平;E(Cmix)表示总复合效应。
多元混合化学物的复合效应还可表述为公式(2-18)。
(2-18)
式中,Smix是毒性加权之和;是化学物i在混合物中导致50%发生率的浓度水平;EC50i是化学物单一作用条件下导致50%发生率的浓度。
当S≤1,加和指数AI=1/S-1;当S≥1,加和指数AI=-S+1。当AI=0,则混合污染物之间为相加作用;当AI<0,则混合污染物之间呈现拮抗作用;当AI>0时,则混合污染物呈现协同作用。
(3)部分相似作用模式下建模方法
事实上,混合物往往不但存在CA模式,还存在IA模式,这是部分相似作用模式。评价部分相似模式的评估方法为TSP方法。该模型可预测含CA模式和IA模式下的化学物混合体联合毒性。预测第一步是将所研究混合物中具有CA模式的化学物归为一组,针对这些不同组内的化学物分别进行CA模式评估,然后将评估完成后的不同组整合起来视作IA模式,按照IA模式评估策略开展评价。事实上即是将CA模式和IA 模式下的公式组合为同一个公式[见公式(2-19)]。
(2-19)
式中,Rmix表示混合污染物中复合毒性;EC50i是造成50%反应率化学物i的浓度水平;Ci是混合污染物中化学物i的浓度水平;p′表示不同化学物占混合污染物毒性当量的均值。该方法主要缺陷是需要明确混合污染物中各化学物毒性水平,同时假定这些物质之间不存在拮抗、协同、增毒和减毒等联合作用,因此该方法应用范围相对较窄,几乎是停留在概念上的模型。
(4)联合作用模式下建模方法
①剂量和效应相加综合模式建模 对于CA模式和IA模式下的风险评估策略可定性判定是否存在拮抗、协同等联合毒性效应,但理论上不能定量分析和评价其复合毒性(Kim et al,2010)。Rider和LeBlanc开发了剂量和效应相加综合模式(IAI),该模型对协同、拮抗等联合作用关键采用K函数进行表达[见公式(2-20)]。
(2-20)
式中,Ka,j(Ca)表征混合化学物中浓度为Ca的化学物a影响化学物i的程度;EC50i表示化学物i引起50%动物反应的浓度水平;p′表示混合物中毒性平均水平。
基于马拉硫磷、对硫磷和增效醚三元混合化学物对细胞色素P450酶抑制效应开展复合风险评估,IAI模型(R2=0.716)的结果明显优于CA模型、IA模型以及IAM模型(R2=0.010)结果。但实际上,IAI模型中使用K函数并无太大可行性,因为该函数需要通过大量试验才能确定,否则该模型不可能成立。
②基于联合作用的危害指数法建模 美国环境保护署(EPA)在危害指数法基础上开发了可实现定量评价具有联合作用混合化学物风险的建模方法,称为基于联合作用的危害指数法(interaction-based hazard index,IBHI),也叫HIint-EPA(Haddad et al,1999)。此方法假定混合化学物中所有化学物之间存在二元联合毒性效应,其模型可表达为公式(2-21)。
(2-21)
式中,HIint表示具有联合效应的总危害指数;Ci代表i物质在混合物体系中的浓度水平;fij表示缩放因子,该因子描述在混合化学物中,可与化学物i产生联合毒性效应的所有化学物中化学物j所占的贡献率;Mij表示化学物i与j最大联合毒性效应,该参数由二元联合毒性反应数据推导得出,如该数据无法获取,则赋缺省值5;Bij表示证据力因子,该因子反映化学物j受化学物i在酶底物产生竞争或诱导影响的强度,同样由二元联合毒性反应数据推导得出;θij表示基于等毒法,化学物i较化学物j的毒性强度。
2.4.6.3 目前前沿的混合化学物建模系统
(1)定量结构-活性关系建模
结构-活性关系(structure-activity relationships,SAR)建模兴起于20世纪70~80年代,是将化学分子特定基团对某特定生物活性作用功能建模的一种方法,其中化学分子功能基团又称为药效基团或毒效基团(Cao et al,1997)。SAR方法总体为定性评估方法,较为粗泛,因此更为精准且基于定量结构-活性关系(quantitative structure-activity relationships,QSAR)方法得到快速和迅猛发展。目前已发展到了六维QSAR模型(6D-QSAR),但2D-QSAR的hansch模型、3D-QSAR的比较分子场分析法(comparative molecular field analysis,CoMFA)模型,以及偏最小二乘法(partial least squares,PLS)求解成为QSAR的经典和基础。当前,利用QSAR建模实现混合化学物毒性预测依然主要集中于挖掘描述符同生物活性效应之间内在机制关联的多维模型以及寻求适合QSAR模型求解和验证方法为目标。
①基于实证描述符的 QSAR在缺乏实验数据的情况下,某种化学品展现活性和性能之间的可接受关系的特性可以通过QSAR模型预测出来。采用QSAR方法来预测混合物毒性,可以描述为实证描述符和非实证量子描述符之间的区别。例如,正辛醇-水分配系数(KOW)是某化学物在正辛醇相与水相浓度之比,可表达化学物亲水性或疏水性。在QSAR建模中,该描述符非常重要且应用广泛。与单一化学物相比,混合化学物的复合正辛醇/水分配系数不再是一个常数,而是混合物组分及两相体积比的函数(So,2000)。
单纯利用众多单一KOW确定混合化学物中KOW很难,因为从物理学手段上无法区分混合物中KOW。Lin等(2003)提出通过利用疏水性描述符膜/水分配系数(KMD)等推导KOW,最终建立2D-QSAR模型以预测混合化学物联合毒性效应的方法,对50种混合卤代苯使用下面的公式,这种方法表现出可接受的预测结果(在P<0.0001的情况下,r2=0.929,SE=0.104,F=169.513)[模型见公式(2-22)]。
(2-22)
式中,EC50M表示该混合物的毒性;KMD表示混合物中C13-EmporeTM膜/水分配系数。
该模型分别基于公式(2-23)和公式(2-24)采用经验和非经验方法预测出KMD和KSD,最终估计得出KOW。
(2-23)
KSD=0.995lgKOW+0.70 (2-24)
n=18,R2=0.93,SE=0.24
式中,KMD表示混合物中C13-EmporeTM膜/水分配系数;表示单一化学物i的分配系数;W表示该溶液的体积;V表示疏水相的体积;表示化学物i在水中初始数量;n表示混合物中单一的化学物总数;W/V值等于0.68×106。
麻醉性化学物,如苯酚、苯胺等的毒性高于非极性麻醉的化学物。麻醉性化学物和非极性麻醉化学物在环境中能够共存。然而,基于疏水性QSAR模型只适用于非极性麻醉的化学混合物。疏水性模型的应用范围扩展到亲水性化学混合物,同时混合物中共同作用的氢键方面的知识完善了基于疏水性的QSAR模型。因此,改进的QSAR模型针对极性和非极性麻醉化学品的混合毒性取得了较好的预测结果(r2=0.885,SE=0.245,F=613.708,P≤0.001的结果只来自于疏水性的QSAR模型;而r2=0.948,SE=0.166,F=745.201,P≤0.001的结果来自于疏水性和氢键为基础的QSAR 模型)。公式(2-25)描述的是基于疏水性和氢键的 QSAR模型。
(2-25)
式中,EC50M表示50%的混合物浓度效果;α、β、γ和δ表示实证常数;KMOW表示混合物中辛醇-水的分配系数;AMH和BMH分别表示混合物中共同作用的氢键(类似于Lewis酸度),这根据不同的混合物在各种有机相/水系统中的分配系数进行量化。
然而,QSAR模型的建立只用来预测混合物的EC50。这个模型从根本上采用CA的概念,只有三个化学基团:苯、苯酚、苯胺进行验证(即极性和非极性的麻醉性化合物)。与其他特定作用的化学品的进一步研究必须在真实的环境中进行。此外,由于需要测量不同类型的有机相/水系统来判断AMH和BMH,因此其实际用途是非常有限的。
如上所示,一般基于实证描述符的QSAR模型,不可避免地需要进行实验数据或复杂的多步骤计算,以确定描述符。传统的QSAR,甚至很多最新的QSAR,经常使用实证描述符,如电离势、分配系数、线性自由能关系(例如,Hammett和Taft参数)及立体描述符(如Sterimol参数)到量化的理化性质。然而,当不易获得实验资料数据集时,实证的QSAR模型难以使用。
②基于非实证量子描述符的QSAR 量子化学描述符可从作为唯一输入、定义了化学结构的个别物质中计算出来。如前线轨道的能量、物质中占据分子轨道的最高能量(EHOMO)以及未占据分子轨道的最低能量(ELUMO)也常用来表征化学反应相对活性。电荷分布、偶极矩、激进的分布、范德华力体积、溶剂化能等也可被计算出来。
Zhang等表明,苯及其衍生物包括8种非极性麻醉物质和4种极性的麻醉物质的二元混合物的毒性,在不参考每一种化学物确切毒性机制的情况下,使用量子化学描述符进行预测,其构建了唯一的输入文件,包括2mol的二元混合物,使用商业软件(Chem3D和Gaussian98)来实施二元混合物的QSAR分析。公式(2-26)和公式(2-27)描述了二元混合物相应的QSAR模型。
(2-26)
(2-27)
式中,EC50M表示混合物中的浓度效果为50%;表示原子周围最大的负电荷;lgEnrM表示原子核排斥力能量的对数;GAPh-lM表示EHOMO和ELUMO的差值;μ表示电偶极矩;GAPVmM表示二元混合物的摩尔体积差值的绝对值。
Lu等建立了一个QSAR模型[公式(2-28)],包括LUMO和辛醇/水分配系数来预测混合物毒性。模型结果显示了二元、三元及四元混合物毒性计算的可能性(n=32,r2=0.834,s=0.139,F=73.01)。
(2-28)
式中,IC50mix表示50%的混合物的抑制浓度;Pmix表示基于相互独立的假设对单一物质分块求和计算得到的该混合物的水分配系数;表示混合物中的LUMO,即对单一物质中的LUMO的简单求和。
因此,基于上述研究现状,QSAR预计将克服只使用单一物质的物化性质的模型限制,推进混合物毒性预测的现有算法研究。
③生理毒代动力学建模 混合化学物风险评估还可通过构建生理毒代动力学模型(physiologically based toxicokinetic,PBTK)实现评价(Barfield et al,2008)。该方法是基于人体或动物体内组织房室或隔室之间质量和能量守恒定理,实现外源化学物母体及其代谢产物在体内及靶组织中吸收、分布、代谢和排泄(ADMEs)的剂量、时间及其过程估算。房室有固定容量,且内部化学物质均匀分布,与化学物性质无关,但总隔室模型(如动脉或静脉血液灌流组织)与化学物相关。因此建立PBTK模型可全面、精准地反映混合污染物在机体内不同靶器官的作用时间、作用方式及作用内剂量变化情况之间的关系,即“时-量”关系。同时为明确作用内剂量与不同靶器官效应之间的关系,即“量-效”关系,建立基于生物剂量-反应(biologically based dose-response,BBDR)模型。PBTK/BBDR建模为全面回答和解释累积性剂量-反应过程提供更为科学的手段(Shuey et al,1994)。
PBTK/BBDR建模涉及的基础模型众多,不再详述,但对于混合化学物评价而言,最重要的是阐明对酶作用位点相同,一种为酶的代谢底物,另一种为酶的抑制或诱导物的二元混合化学物联合毒性代谢动力学关系。建模首先应建立混合物中单一化学物的PBTK模型,然后开发可描述联合作用的描述符,以表达基于酶的竞争抑制或诱导作用。化学物1的代谢动力学RAM1(化学物2也可如此描述)可采用优化后的米氏方程表述[见公式(2-29)]。
(2-29)
式中,vmax1和KM1分别表示化学物1的最大速率及其米氏常数;C1和C2分别表示化学物1和化学物2的浓度水平,而此二元化学物均与相同酶作用;I2,1表示在化学物1代谢中发挥竞争性抑制作用的化学物2的竞争性抑制常数(质量/体积)。
对于多元(超过三种以上)混合化学物之间联合作用相对更复杂,如对含5种化学物的混合体,它们之间可能存在的多元混合效应和关系可以用图2-6描述。
图2-6 多元混合化学物联合效应关系(Shuey et al,1994)
④基于机器学习的算法 建立用于预测混合物毒性的大多数传统模型需要混合物成分完整的定性和定量数据,如摩尔成分、剂量-反应曲线、用于确定成分间组合效应类型的方法。在假定混合物是通过完全相似或相异作用的化学品制备的理想情况下,该模型已被证明是对混合物有效的。然而,生物体暴露是在有更多复杂混合物的环境中的,包括相似和相异的作用方式。
Mwense等提出了一种称作综合模糊CA-IA模型的新方法,该方法结合了QSAR方法和模糊集理论,以对混合毒性进行评估。基于含有相似和相异作用方式的混合物成分暴露于真实环境中这一根本假设,该模型采用了模糊集理论来说明混合物中化学品的相似性和相异性程度。这种方法被用于确定混合物的毒性,无论混合物的成分是否具有相似的、相异的或两者皆有的作用方式。该研究表明,其可对具有相似和相异作用方式的化学品混合物的毒性进行预测。此外,对具有完全相似或相异毒性作用方式的混合物的毒性预测结果是精准的,且与CA或IA模型所预测的结果更准或相当。公式(2-30)和公式(2-31)为INFCIM的概念,可用于计算混合物的毒性。
ECx,mix=ωA×(CA)+ωB×(IA) (2-30)
(2-31)
式中,ECx,mix表示混合物效果浓度;系数ωA和ωB表示权重,其可通过用于计算CA和IA贡献的与相似度和相异度一致的二元分子距离的分子描述符和模糊隶属度函数模型估算;αsim表示内部相似;αdis表示内部相异。
模糊集是由其子集与子集的隶属度确定的。模糊集中子集的隶属度是由隶属函数确定的。INFCIM方法仅需要两个附加参数αsim和αdis,这两个参数仅由混合物毒性的一个数据集就可确定,也就是说,由给定成分的混合物的浓度反应曲线确定。子集的隶属度值范围为0~1,即在模糊集算法内能够确定相似度和相异度之间的度。Mwense等还对模糊隶属集进行了详细描述以及对INFCIM方法进行了概述。
(2)基于整体风险概率法
全风险概率(overall risk probability,ORP)模型通过暴露和效应两个累积概率函数综合来量化健康风险(Boehm,1991),其总体是基于概率评价手段来估计风险,区别于大多数依赖于点估计的评估方法,也可称为多点评估方法(multiple-point method)(Strebelle,2013)。非概率方法(点估计)的优点是易于理解,数据相对要求较少且容易获得,成本较低等,但计算出来的风险结果是单点效应的风险,精确性不够,不能完成评估现实环境中人类接触各种浓度污染物的可能性;而概率方法则相对复杂,数据量也相对多,获取成本也较高,但结果总体精确度和描述结果的科学性优于非概率方法,且可更全面地描述现实情况中接触不同浓度多种污染物的风险。Cao等(2011)首先整合了剂量-反应评估和暴露评估,将暴露曲线(ExpC)和效应曲线(EffC)在同一个风险概率图上表达,实现全风险概率估计的目的。初级 ORP 方法更多注重对单一物质所导致的全风险概率的评价。Yu等(2011)在此基础上提出并引入联合毒性因子(aij)来表征m种化学物体系中化学物i对化学物j产生联合毒性效应的性质及强度,同时定义了该值范围为-1≤aij≤1,在实际计算过程中,默认拮抗效应缺省值为-1,而协同效应缺省值为1。ORP方法亮点在于:将剂量-效应-暴露关系用概率估计手段进行整合来获取总体风险,简便而直观;通过aij引入,实现多种污染物联合毒性效应的概率估计。
在全风险概率评估方法中,暴露值与效应值通过概率分布函数来表示,并展示在同一个坐标系中。而在传统的单点风险评估方法中,风险由危害系数(hazard quotient,HQ)来表示,它是95%累积概率的暴露剂量值除以5%累积概率的效应剂量值,使用实际计算出的HQ值与参考值进行比较,可评估该污染物的有害健康风险是否显著。但HQ风险评估方法只是单点风险评估方法,不能反映现实环境中不同剂量污染物产生不同程度的毒效应的真实情况。
ORP模型主要涉及暴露曲线、效应曲线、暴露超过值曲线及其关系来共同决定联合风险。其中暴露曲线(exposure curve,ExpC)是指污染物在环境中暴露剂量的分布曲线。对于单一污染物来说,有该污染物以单一形式存在时的暴露曲线。对混合污染物来说,有混合污染物的暴露曲线。分布曲线通常使用分布拟合来获得,常用的分布函数如下。
①正态分布:
②对数正态分布:
③伽玛分布:
④Logistic分布:
⑤对数Logistic分布:
⑥Probit分布:P(dose,α,β)=Φ(α+βdose),其中Φ是标准正态分布函数
⑦对数Probit分布:P(dose,α,β)=Φ[α+βln(dose)],其中Φ是标准正态分布函数
⑧Weibull分布:
⑨指数分布:P(dose,α)=αe-αdose
效应曲线(effect curve,EffC)是指污染物以不同剂量作用于生物体时的效应,即剂量-效应曲线。对于单一污染物来说,有该污染物以单一形式存在时的效应曲线,有该污染物以混合形式存在时的效应曲线,但前者可通过实验获得,而后者无法量化。对混合污染物来说,有混合污染物的效应曲线。效应曲线通常使用函数拟合来获得,由于剂量-效应曲线通常为S形曲线,故使用Logistic曲线来拟合。
暴露超过值曲线(exposure exceed curve,EEC)首先要明确暴露超过值。将污染物的暴露曲线和效应曲线合并在同一坐标系,如图2-7所示,在效应曲线(剂量-效应曲线)上,纵坐标x%表示某毒性效应的概率值,横坐标表示x%效应下在效应曲线对应的剂量水平值dosex。在同一个坐标系中,剂量水平值dosex对应于暴露曲线中暴露量的概率值y%。则1-y%为潜在存在风险的部分,这部分称为暴露超过值,实际上该部分是需要引起关注的对人体健康有害的范围。
图2-7 暴露曲线与效应曲线的汇总图
通过不同的剂量值(即图2-7中的横轴表示),将效应曲线上的效应概率(x%)与暴露曲线上的风险部分(1-y%)对应,投射到新坐标中形成图2-8,在图2-8中,横坐标表示有害毒性效应的概率,而纵坐标表示暴露超过值。其中如果有害毒性效应为x%,则其暴露超过值为1-y%,这条曲线定义为暴露超过值曲线。这条曲线的含义是指在产生特定效应时,对应潜在风险大小。
图2-8 暴露超过值曲线图
全风险概率(ORP)是对暴露超过值进行累加,即暴露超过值曲线与坐标轴之间的面积,见图2-8阴影部分,这个阴影部分的面积便是全风险概率,ORP取值范围为0到1。全风险概率值越大,表示风险越大。
(2-32)
式中,Pm表示混合污染物的ORP;Pi表示污染物i在混合形式下的ORP值;n表示混合污染物体系中污染物的数量。
(2-33)
公式(2-33)中,给出了公式(2-32)中Pi的求取方法,其中表示污染物i在单一形式存在下的ORP值;aij表示联合毒性效应系数,表征i与j之间的联合作用及其性质(协同、拮抗等)。