2.7 “意见不一致点”的确定
“意见不一致点”(v1, v2)如何确定呢?有时候,它是自然生成的。譬如,两人分蛋糕的博弈,按照游戏规则,如果两个人无法达成合作协议,双方摆出一副鱼死网破的架势:“如果你想多得,宁可鸡飞蛋打”,最后结果一定是人人颗粒无收,于是(v1, v2)=(0,0)。
在许多场合,倘若双方谈不拢,则可能进入一场非合作博弈,如果这个非合作博弈存在唯一的纳什均衡,那么相应的盈利向量作为“意见不一致点”应该是个合理的选择。“囚徒困境”就是一个例子。两人为了合作从而订立了“攻守同盟”协议,就有可能达到(-1, -1)这样最好的效用配置,但是倘若无法达成协议,随即面临的是非合作博弈,为了极大化个人的效用,其结果应该是(坦白,坦白),因此效用配置(-8, -8)就是一个“意见不一致点”。
利用非合作博弈中的唯一的纳什均衡来确定“意见不一致点”,存在两个缺陷:
(1)如果唯一的纳什均衡恰好又是Pareto最优,可能不适合选择为“意见不一致点”。我们不妨先观察一个例子。
例2.5 策略型博弈如图2.5所示:
图2.5 纳什均衡的“盈利向量”未必一定取为(v1, v2)
图2.5的博弈,合作将产生最大的效用1 +1 =2 =v12,只要有一方偏离或不合作,双方都只能得到0。因此,很自然地,(0,0)可以取为(v1, v2)。但是,这个博弈唯一的纳什均衡是(合作,合作),如果我们将相应的“盈利向量”(1,1)取为(v1, v2),那么这个合作博弈就成为非实质性的两人讨价还价问题了。
(2)多重纳什均衡的情况,取哪个均衡为好呢?当然,对于实质性的两人讨价还价问题,人们可以提出取“焦点均衡”。下面我们有这样的一个例子,它至少拥有两个纯策略的纳什均衡,但是你实在无法说出哪个是“焦点均衡”。我们认为,在这个例子中,混合策略的纳什均衡相应的“盈利向量”不失为“意见不一致点”的一个合适的选择。
例2.6 策略型博弈如图2.6所示:弈有一个混合策略纳什均衡,局中人的期望盈利各为。可以令就是我们需要寻找的(v1, v2)。由于两人合作的最大可能共有盈利为v12=3 +4 =7,由(2.11),得。这是一个合理的结果,尽管(4,3)和(3,4)都是均衡盈利向量,但是出于极大化个人效用的角度,谁都希望自己多得。合理的协商结果应该是,在(A, A)和(B, B)之间确定一个,然后双方平分总收入。
图2.6 混合策略的“盈利向量”选择为(v1, v2)
从非合作博弈的角度,这个博弈有两个纯策略纳什均衡(A, A)和(B, B),它们对应的盈利向量为(4,3)和(3,4)。看来,任何一个都不适合作为(v1, v2),因为“4”使得其中的一个局中人得到自己的最高盈利。显然,任何的不合作行动都会使他们一无所有。不过,博
这个例题很有趣,如果我们取v=(0,0),得到的讨价还价结果仍然是。其实,只要v1=v2≤3,讨价还价结果都一样。然而(0,0)可真的是底线中的底线了,作为理性人,在(A, A)和(B, B)之间的协商以及在协商结果的分配方面的谈判失败之后,不会轻易地领受最低待遇0,而极大化个人效用的结果最少也是,因此我们认为在这里v=是一个合理的选择。
确定“意见不一致点”的另一种方法是利用最小最大值:设σ1与σ2分别是局中人1与2的混合策略,u1(σ1, σ2)和u2(σ1, σ2)分别是他们在策略剖面(σ1, σ2)下的盈利,令
(v1, v2)有可能成为合理的一个“意见不一致点”。最小最大值反映了这样的思路:局中人在试图极大化自己的效用时,不得不考虑对方也在采取极大化他的效用的策略,对方每取一个策略时自己有一个最大的效用,因此这个所谓的“最大效用”是随着对手的策略而发生变化的,取这个变化函数的最小值应当是最为“保险”的“底线”。在谈判过程中以这个最小最大值作为“砝码”,有点“退一万步来说”的味道,对于某些场合某些局中人来说,有“太低”的感觉。
其实,世界上的任何事情都不是绝对的,如果v12远远大于v1和v2,也许谈判的双方不会将“底线”看得太重。合作的前景是“大西瓜”,手中的一粒芝麻不应当成为妨碍合作的筹码,这是任何一个理性人都明白的事。过低的v1和v2反而是促进合作的动力。
不管怎么样,我们已经明白,“意见不一致点”很有可能会影响到谈判的结果和达成协议的前景。因此,局中人会受到激励在形成协议之前提高自己的vi和降低对手的vj,以增加谈判中讨价还价的资本。如果自己的vi过低或对手的vj过高,肯定不利于自己在讨价还价中的结果。在实力允许或条件可能的时候,在讨价还价的谈判之前,局中人有发动一场“战争”的动机和动力。这样一来,博弈建模可以分为展开型的两个阶段:第一阶段确定双方的vi和vj,在这个基础上,展开第二阶段的讨价还价。毫无疑问,第一阶段的结果将影响到第二阶段的讨价还价的策略、手段和最后的结果。“为了消灭战争,不得不进行一场战争”就揭示了类似的道理。“为了消灭战争”,就是希望和平,希望合作,为了缔结和平合作的协议,有必要提高自己在谈判中的地位和筹码,那么很有可能“不得不进行一场战争”。
战争的双方,如果谁也无法吃掉对手,谈判是解决冲突和争端的最优途径。假如双方用谈判来停战并划分军事分界线,倘若“领土”视作常量,那么谈判就是一个具有可转移效用的两人讨价还价问题。只要自己具备实力,谈判之前发动一次战役将自己占领的阵地大大地往前推进,无疑会增强在谈判中的地位。解放战争中的平津战役是一个典型的案例,包围北京,旨在和平解放而不希望武力解决(这是最好的“合作”,因为这样可以使北京的名胜古迹和几千年的中华文化免遭破坏),但是单纯想达到这一点是有一定难度的。打下天津,切断北京守军的退路,使得和平谈判的可能性大大增加,事实上,正是通过先解放天津,最终使得北京获得了和平解放。20世纪50年代的朝鲜战争也出现过这种情况,长期残酷的战争使得和平谈判成为大势所趋,为了使军事分界线至少维持在战争之前的“三八线”,中国人民志愿军不得不发动第五次战役,打过“三八线”,从而提高了自己的谈判筹码。
“意见不一致点”的确定通过谈判前的某种对抗与冲突得以解决,体现了一个从非合作到合作的博弈过程。然而,用非合作的办法去确定“意见不一致点”,有时候未必一定要实现一场冲突或者发动一次战役,在许多情况下,“威胁”与“承诺”常常可以取而代之。
如果考虑使用威胁以试图“迫使”合作成功,那么一旦觉得无法达成合作协议,局中人将会各自实施自己发出过的威胁(否则,威胁将成为“空头”的,起不到威胁的作用)。不同的威胁导致不同的“意见不一致点”,从而导致不同的结局。可以通过图2.7来说明:
图2.7 不同威胁导致不同的z1, z2,从而导致不同的x与y
在图2.7中,对应“意见不一致点”z1的讨价还价解是x,对应“意见不一致点”z2的讨价还价解是y。显然,局中人1希望通过威胁使意见不一致点往z2靠,因为解y对自己有利,而局中人2则希望通过威胁使意见不一致点尽量往z1靠,因为解x对局中人2有利。
假设局中人1的威胁为τ1,局中人2的威胁为τ2,由这两个威胁组成的“策略对”(τ1, τ2)随着τ1与τ2的变化产生不同的“意见不一致点”,理性的局中人都希望意见不一致点尽可能地对自己有利,于是,事实上我们先面临一个非合作的策略型博弈。假设Γ为两人有限策略型博弈,即
其中,Ci(i=1,2)为局中人i的策略集,ui为局中人i的盈利函数。在具有可转移效用的情况下,令F是由Γ导出的可行集:
在谈判或者仲裁之前,局中人i从混合策略集Δ(Ci)中选取策略作为威胁τi,于是两人讨价还价问题相应于威胁(τ1, τ2)的“意见不一致点”将为(u1(τ1, τ2), u2(τ1, τ2))。在这个“意见不一致点”(u1(τ1, τ2), u2(τ1, τ2))下求两人讨价还价的解,记为(w1(τ1, τ2), w2(τ1, τ2)),沿用我们已经引入的记号,当i=1,2时,有
(w1(τ1, τ2), w2(τ1, τ2))其实是在威胁(τ1, τ2)下的两人讨价还价的解。研究合作博弈,是因为合作有着非常好的前景,采用威胁(τ1, τ2),无非是想在分配合作成果时为自己争得先手。所以,在合作对双方都有较大好处的前提下,合作是第一位的,威胁的实施与否相对地是第二位的。既然威胁未必实施,如何评估威胁是否有效呢?最后的合作协议——(w1(τ1, τ2), w2(τ1, τ2))是最好的评估办法。理性的局中人一定会采用使自己的wi(τ1, τ2)达到极大化的威胁τi,譬如,对于局中人1来说,在给定对手(期望)威胁τ2的情况下,从自己的混合策略集Δ(Ci)中选取τ1使得
同样,τ2的选取使得在给定τ1下,有
显然,只有这样的τi才体现出局中人i的理性,因此,干脆称这样得到的(τ1, τ2)为一对理性威胁。可见,理性威胁实际上是如下“威胁博弈”的纳什均衡:
问题在于,“理性威胁”是否一定存在,也就是说,在威胁博弈中是否存在纳什均衡。与一般博弈中的纳什均衡存在性的证明一样,这里的纳什均衡的存在性条件与证明需要借助于著名的KaKutani不动点定理(有兴趣的读者可以参看:《博弈论》(第三章的第四节),施锡铨编著,上海财经大学出版社,2000年)。在本书中不作介绍。
下面构造一些简单的例子来说明不同方法确定了不同的“意见不一致点”,产生了不同的纳什讨价还价解。
例2.7 考虑如图2.8的两人策略型博弈Γ:
图2.8 两人策略型博弈Γ
注意到在策略型博弈Γ中,如果局中人1与2合作,实施结局(a, A)或(b, A),那么可以得到最大的共同盈利10,即v12=10。因此合作协议应该是对10的分配。这是一个可转移效用的合作博弈。一旦确定了“意见不一致点”v=(v1, v2),利用式(2.11)就可以得到纳什讨价还价解。
先看从Γ导出的威胁博弈Γ*,考虑纯策略形式,对于每一对纯策略组合,以相应的“盈利对”作为“意见不一致点”,计算出对应的w1和w2:
对(a, A),盈利向量为(10,0),故;
对(a, B),盈利向量为(7,1),故;
对(a, C),盈利向量为(-4, -4),故;
对(b, A),盈利向量为(0,10),故;
对(b, B),盈利向量为(4,0),故;
对(b, C),盈利向量为(-5, -5),故。
将上述计算结果排列成如图2.9的纯策略形式:
图2.9 由图2.8的Γ导出的(纯策略)威胁博弈Γ*
照例,Γ*应该包含混合策略的,然而,简单的数学推导可知,由图2.8的Γ中的混合策略所产生的“盈利对”作为“意见不一致点”,所得到的(w1, w2)恰好是由图2.9中两个局中人以“与图2.8中原先采用的混合策略”一样的混合策略所产生的(w1, w2)。因此,这里我们不妨考虑图2.9的Γ*,其纳什均衡是(a, C),所以,以(-4, -4)作为“意见不一致点”,其纳什讨价还价解为(5,5)。(当然,有人会说,以(-5, -5)作为“意见不一致点”,可以得到同样的讨价还价解。但是,必须看到,(-4, -4)优于(-5, -5),谁会把谈判的“底线”故意往下降低呢?)
现在再考虑Γ,显然它有唯一的纳什均衡(a, B),相应的盈利向量(7,1)可以考虑作为“意见不一致点”,得到的纳什讨价还价解为(8,2)。
如果我们考虑最小最大值方法,局中人1与2的最小最大值都是(-4),因此相应的纳什讨价还价解为(5,5)。