4.2 证据冲突度量问题
4.2.1 冲突度量函数的概念
为了研究冲突度量函数(conflict measure function,CMF),首先引入广义幂集空间的概念,进一步给出冲突度量函数的定义,并给出几个定理研究冲突度量函数的存在性和必要性。
广义幂集空间是证据源融合的运算空间,根据实际应用对该空间内的所有命题(元素)进行广义基本概率赋值。这里不失一般性,假设广义幂集空间为GU,U为某种模型的识别框架。如果GU={U},那么就是贝叶斯概率幂集空间;如果GU={U,∪},那么就是DS证据理论幂集空间2U;如果GU={U,∪,∩},那么就是DSm理论超幂集空间DU;如果GU={U,∪,∩,ℓ},那么就是UFT广义超幂集空间S U [106]。
定义4.1 (证据冲突度量函数)考虑任意三组映射在相同命题空间GU的广义基本概率赋值:m1 (·), m2 (·)和m3 (·),如果满足下面四个基本条件,即
(1)对称性:∀m1(·),m2(·),CM(m1,m2)=CM(m2,m1);
(2)一致性:∀m1(·),m2(·)∈GU,且m1(·)=m2(·),CM(m1,m2)=0;
(3)非负性:CM(m1, m2 )∈[0,1],当且仅当,那么X∩Y=∅。这里,表示仅支持X, X∈GU的概率赋值,对所有的命题Y ≠X,被定义为和;
(4)单调性:如果CM(m1,m2)>CM(m1,m3),那么m2与m1比m3与m1冲突更剧烈。
则映射CM(·):GU×GU→[0,1]为冲突度量函数,CM(m1,m2)被称为m1(·)与m2 (·)之间的冲突度量函数。
定理 4.1 对任意广义基本概率赋值(实际上,也可以称为一个|GU|维矢量),如果给定足够小的正实数ε,那么至少存在一个|GU|维广义基本概率赋值,满足冲突度量CM(·,·)并使CM(·,·)≤ε。
证明:反证法,在给定ε的前提下,假设不存在这样的广义基本概率赋值,使得CM(·,·)≤ε,如果m1(·)=m2(·),可知CM(·,·)=0,根据ε>0,所以CM(·,·)≤ε,这与假设相矛盾。又因为冲突度量CM(·,·)是连续的,那么对满足冲突度量CM(·,·)≤ε的是不唯一的。
证毕。
定义 4.2 (证据源的低冲突性)如果存在两个广义基本概率赋值,以及某种冲突度量CM(·,·),使得两者之间的冲突度量小于某一个给定足够小的正实数ε,即CM(·,·)≤ε,那么证据源S1提供的m1(·)与证据源S2提供的m2 (·)在冲突度量CM(·,·)下是低冲突的。
定理4.2 假设存在两个|GU|维广义基本概率赋值,必存在如下充要条件:若m1(·)与m2(·)在冲突度量CM(·,·)下是低冲突的,那么必满足定理4.1。
证明:首先证明充分条件:因为,且m1 (·)与m2 (·)在冲突度量下是低冲突的,由定义4.2可知存在足够小的正实数ε,使得两者之间的冲突度量CM(·,·)≤ε,因此满足定理4.1。
再证必要条件:由定理4.1可知,对于|GU|维,如有足够小的正实数ε,必存在|GU|维,使得CM(·,·)≤ε,所以满足定义 4.2,因此m1 (·)与m2 (·)是低冲突的。
证毕。
定理 4.3 若给定的正实数ε越小,之间的距离越近,也就是说, m1 (·)与m2 (·)之间的冲突越小。
证明:根据定理 4.2,如果m1 (·) 与m2 (·) 之间的冲突越小,必定有CM(·,·)<ε,令ε=CM(m1,m2),当ε越来越小时,CM(m1,m2)就越来越小,根据冲突度量函数的定义,那么m1 (·) 与m2 (·) 之间的冲突越小,若当ε=CM(m1,m2)=0时,那么m1(·)与m2(·)完全一致,没有冲突。
证毕。
通过上面几个定义和定理可知,冲突度量函数是一个度量两个证据冲突的理想工具。那么关键问题是如何找到这样的冲突度量函数。下面给出几个冲突度量函数。
4.2.2 自冲突问题
证据之间的冲突是普遍存在的,那么证据本身是否有冲突呢?这里引入自
冲突的概念[107,108]。
正是由于识别框架的信息具有不完备性和不确定性,任一证据源所提供的证据均有自相矛盾的因素,如对一假设及其非都有基本概率赋值,这本身说明此证据本身隐含自矛盾性。为刻画证据的自矛盾性,定义一个自冲突强度,对任一广义基本概率赋值函数m,称
为m的自冲突强度。
例4.1 设识别框架U={A1 , A2 , A3},有一证据源的BPA:
其中, x, y, z为[0,1]之间的任意值,且满足x+y+z≤1,则有m(∅)=xy+xz+yz。
当x=y=z=0时,由于是完全无知,故没有自冲突;
当x=0或y=0或z=0时,由于只对A2, A3或A1, A3或A1, A2有支持证据,而对其他是无知的,故有一定的冲突;
当x≠0或y≠0或z≠0时,随着无知程度的减少,冲突会增加,特别是当x=y=z=1/3时,达到最大冲突。
例4.2 设识别框架为U,|U|=3,表4.1给出U上的三组基本概率赋值。其中1、2分别标记识别框架中命题A1、命题A2,如情况1中的m2为({1,2,3},1)指的是m2 ({1,2,3})=1。表4.2列出三组基本概率赋值的自冲突强度。
表4.1 三组基本概率赋值
表4.2 三组基本概率赋值的自冲突强度
显然,3种情况都存在一定冲突,但是除了情况2中m1的自冲突强度不为0,其余都为 0,这从另一方面说明用单个证据的自冲突强度来度量证据之间的冲突是不合适的。
虽然自冲突的定义是基于矛盾论的观点提出来的,证据自冲突可视为事物自身(内部)的矛盾,但无法衡量证据间的冲突,因此运用证据的自冲突进行证据的冲突度量是不合适的。而且证据的自冲突与DS组合规则的使用没有太大的关联,因此在以后的讨论中不再进行叙述。
4.2.3 冲突表示方法的问题
研究表明DS证据理论中冲突系数K无法有效度量证据之间的冲突,最直接的例子就是在度量完全一致证据和都是嵌套子集的证据时出现悖论。在Shafer模型下进行数值实验。
例4.3 设识别框架U={A1, A2, A3, A4, A5},有两条证据的基本概率赋值m1和m2分别为:m1({A1})=m1({A2})=m1({A3})=m1({A4})=m1({A5})=0.2,m2=m1。
K=0.8,按照DS证据理论,这两个证据之间是高度冲突的,运用DS证据理论的融合效果应该变差。实际上,这是两个完全相同的证据,两者之间根本不存在冲突,这说明传统冲突系数K此时不能合理度量证据之间的冲突。但矛盾的是融合结果m=m1⊕m2=m1=m2,这说明DS证据理论没有体现它特有的聚焦特性,即没有必要运用DS组合规则,这与基于K判断DS证据理论的融合效果变差而不建议使用DS证据理论似乎又一致。以上是否可以理解为K在度量冲突上不是一无是处?
例4.4 设识别框架U={A1 , A2 , A3},有两条信源的证据m1和m2分别为:m1({A1, A2})=1, m2({A1, A2, A3})=1。
运用DS证据理论,m({A1,A2})=1,K=0判断证据之间不存在冲突。实际上, m1和m2之间是存在冲突的,都没有给出支持各目标的可能性,而且有可能不是平均支持各个目标,因此显然是存在冲突的。这也从另一个方面说明K无法很好地表征都是嵌套子集的证据之间的冲突。
Liu 认为传统的K并不能有效地度量证据之间的冲突程度,提出通过引入Pignistic概率距离,与K结合起来描述冲突的大小。她认为可以描述两个证据之间的关系,判断它们是否冲突、是否高度冲突、DS 组合规则是否适用[68]。difBetP的定义如下[68]:
m1和m2是识别框架的两条证据,和分别是独立的 Pignistic距离,则
其中,BetPm( A)=∑ϖ∈ABetPm(ϖ),并记为difBetP。
例4.3运用Liu的方法可得出difBetP=0。Liu的思路:K=0.8,difBetP=0,表明证据之间没有明显的区别,应慎重使用DS证据理论。其与实际情况还有一定的出入。但是Liu的方法比基于K度量完全一致证据的冲突更为合理。
例4.4运用Liu的方法可得出K=0,difBetP=0.33。按照Liu的思路,应该谨慎使用DS证据理论。这也说明Liu的方法比基于K度量更合理地度量都是嵌套子集的证据之间的冲突。
尽管 TBM 和文献[68,69,109]提供了新的思路研究冲突度量,但是它们在信息源提供的信息不是很充分时就进行概率转化,会曲解信源提供的证据。
例4.5 设识别框架U={A1 , A2 , A3},两条证据m1和m2分别为:m1 ({A1})=, m2({A1, A2, A3})=1。
运用Pignistic概率转换对m2进行概率转换,可得:BetP( A1 )=BetP( A2 )=,与原来的m1完全一致。Liu的思路:K=0,difBetP=0,这两个证据是完全没有冲突的。原因是Liu提出的Pignistic概率距离表征的是证据之间的差异性(单子集之间的最大差异),并没有从整体上考虑证据对各个目标支持的差异。Liu 的方法在处理多子集时,把多命题焦元对应的信度依据均分的思想平均分配到各单子集焦元上。通过经典冲突系数K和Pignistic概率距离这两个参数的结合来判断证据之间的冲突,只是反映了证据之间的差异性,而没有考虑证据之间具体的相似程度,没有考虑两条证据对各个目标支持度之间的相关性。文献[79]得出OWA(k,difBetP,1-r)=0.1423,表明证据之间是有冲突的。虽然基于模糊语义量化算子的权重求解方法比较简单,但其精确度比较差,不利于决策者真正表达其偏好。
实际上,原来的两证据支持的目标是不同的,证据1对目标A1、A2、A3的支持度都是,而证据2支持整个目标集,没有单独地支持某个目标,也没有表明是平均支持3个目标,很有可能是不等分地支持3个目标。先进行Pignistic概率转换再进行冲突的判断似乎不太合理,因此,我们在信源提供的信息不是很充分时,应该尽可能地利用信源提供的证据本身具有的特征,以防止有用信息的丢失,建议判断原来信源提供证据的冲突程度,不要人为地改变原有证据的可靠性。而且,在考虑冲突参数时,不仅要考虑各子集的BPA,还要考虑各子集的个数。