第一节 了解博弈论
1.1 博弈论及其分支
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可供选择的行为或是策略进行选择并加以实施,并从各自的策略选择中取得相应结果或收益的过程。博弈理论中主要有两个分支:协调性博弈和非协调性博弈。非协调性的博弈理论主要研究个人在努力达到自身目的的同时如何影响其他人。除了博弈论,经济学理论还有另外几个主要的分支:决策理论、综合平衡理论和机制设计理论。这些理论都与博弈论有着紧密的联系。
决策理论可以看做是研究一个人的博弈的理论,或者可以看做是一个人与自然之间的博弈。所关注的点是偏好和信仰的形成。运用最为广泛的决策理论认为,在有风险的选择之中的偏好可以被效用函数的最大化的预期值决定。在这个效用函数中,效用取决于很多因素,但是在经济学家所感兴趣方面的情况中,效用取决于收入。为了很好地体现收入的不确定性,概率论在决策理论中大量使用。贝叶斯法则是用来模仿新信息如何修正偏好的一种重要的方式。运用决策理论最普遍的形式是决策分析,这种分析用来表现如何在作出决策之前最好地获得信息。
综合平衡理论可以看做是博弈论中专门研究生产和交易的分支,并且有代表性地研究大量相关的单个消费者和生产者。它广泛地运用于分析宏观经济政策,例如货币政策和税收政策;分析股票市场、利率、汇率和其他价格等。最近几年来,政治经济学开始表现为综合平衡理论和博弈理论的综合,在博弈论中,经济中的私人部门被综合平衡理论规范,而投票行为和政府激励则是用博弈论来分析的。研究的问题包括税收政策、贸易政策和国际贸易协定的作用,例如欧洲联盟。
机制设计理论与博弈论不同。博弈论是在博弈已给的规则下进行的,而机制设计理论则是要寻找不同形式的规则所带来的结果。因此,机制设计理论在很大程度上要依赖于博弈论的分析。机制设计理论提出的问题包括可以在提供激励的同时有效地分散风险的赔偿和工资协议的设计,以及拍卖的设计以最大化收益,或者达到其他的目的。
1.2 一个简单的例子:囚徒困境(Prisoner's Dilemma)
描述一次博弈的一种方法是列出博弈的参加者,对于每一个参加者,列出适合于他的可供选择的方法,称为行动或者策略。在两个人博弈中,第一个参加者的行动形成矩阵的行,第二个参加者的行动形成矩阵的列,矩阵中的关键是两个数字分别代表第一个和第二个参加者各自的效用或者赢利。一个非常著名的博弈就是囚徒困境。在这个博弈中,两个嫌疑犯是一次犯罪行动的协调者,均被警察逮捕了。每一个嫌疑犯被分关在一个单人房间里,并且给他认罪的机会。这个博弈可以用下面的这个利益矩阵来表示。
其中,数字越大表示效用越大。如果两个嫌疑犯都不认罪,他们将获得自由,并且可以分得他们犯罪的收益,我们用5个单位来表示他们每个人获得的效用。然而,如果任何一个囚徒认罪而另一个不认罪,认罪的那个囚徒作了不利于另一个囚徒的证明以换取自由,并且获得整个10个单位的效用,而另一个不认罪的囚徒将落入监狱并且什么也得不到。如果两个囚徒都认罪,那么他们两个将得到一个减量的判罪,但是两个人都将被宣告有罪,我们用1个单位的效用来表示这个结果,这个结果要比一个人认罪而另一个人不认罪的情况要好,但是要比两个人都获得自由的情况差。
这个博弈游戏之所以如此吸引博弈理论家是因为以下种种理由。首先,它是对很多重要情况的一个简单的表达。例如,代替认罪或不认罪的说法,我们可以将这个策略称做“为公共利益贡献”或者“自私地行动”。它描述了很多经济学家称做是公共利益问题的情况。
一个很好的例子就是桥的建设问题。如果桥建好了,将对每一个人都有好处,但是只有在有其他人建桥的情况下才对每一个人的利益最大。这就是经济学中常说的外部性。同样地,这个博弈情况可以用来描述在一个市场中竞争的两家公司,代替认罪或者不认罪的说法,我们可以将这个策略称为“制定一个高价格”和“制定一个低价格”。自然地,如果两家公司都制定一个高的价格,这将对两家公司都有好处,但是只有当另外的公司制定一个高的价格而这两个公司制定一个低的价格时才获得最大的好处。
这个博弈的另一个特点是,从这个博弈的过程中能够不言而喻地看出每一个有才智的个人应当如何作出行动。不论每一个嫌疑犯认为他的合伙人将作出什么选择,认罪总是最好的。如果在另一个房间的合伙人不认罪,这个房间里的人将有可能获得10个单位的效用,而不是5个单位。如果另一个房间的合伙人认罪,这个房间的人将有可能获得1个单位的效用,而不是什么也得不到。每一个人明智的选择导致了每个人只能获得1个单位的效用,远比当两个人都不认罪所获得的5个单位的效用要少。这种追求个人目的与公共利益之间的冲突正是许多博弈问题的核心。
第三个特点是,如果这个博弈重复进行,或者如果博弈的参与者在将来能够相互影响,它的结果将在很大意义上被改变。假设在一次博弈结束后,这两个嫌疑犯被监狱释放了,或者免除罪行了,如果他们再次犯罪,那么这个博弈游戏会再次进行。既然这样,那么在第一次博弈的时候这两个嫌疑犯可能会推断他们不应该认罪,因为如果他们不认罪,他们的合伙人就不会在第二次博弈时认罪。严格地说,这个结论并不是有效的,因为在第二次博弈时,两个嫌疑犯都会认罪,不论在第一次博弈时发生了什么。然而,重复博弈能够在将来引起为现在行为所造成的奖励或者惩罚,并且博弈理论学家已经提供了大量的方法用来解释一种显然的直觉,如果博弈被重复得足够多,嫌疑犯应该会合作起来。