囚徒的困境
上QQ阅读APP看书,第一时间看更新

博弈表

我们还有另一种方法来研究博弈,而且这种方法在博弈论中的用处很大——这就是让博弈等价于一张所有可能结果的表格。

如同我们之前说明的那样,国际象棋的可能进程数量虽然极大,堪称天文数字,但总是有限的。因此,下棋的策略数也是有限的。我们已经多次用过“策略”这个词了,现在对它下个定义。在博弈论中,策略是一个重要的概念,它比通常意义下的策略有更为精确的含义。当玩象棋的人说到策略时,他指的是像“用国王进行印度防御印度防御:由德国的国际象棋大师保尔森于1879年发明的一种封闭性开局策略,至今仍被许多棋手采用。——译者注、进攻”这类事。而在博弈论中,策略指更加特定的一种计划,是对博弈的一种特定方法的完整描述,该方法不管对方怎样进行博弈,以及博弈会持续多久。策略必须周密地预先描述所有的行动,以致你永远不需要在某一行动之后再做什么决定。

作为举例,在连城游戏中先走的那名游戏者的一个实际策略如下:

X置子在中央方格。O可能有以下两种反应方法:

 

1.若O占据非四角方格,则X置子于挨着O的一个四角方格。这样X就有2子一线了。若O在下一步中没有进行封堵,那么X就可造成3子一线的赢局。如果O进行了封堵,那么X应置子于另一个空着的四角方格,这个方格同第一个O(非角方格)是不挨着的。这样X就有两个2子一线,不管O下一步怎么做,X都可以造成3子一线从而取胜。

2.如果O的第一步是置子于四角方格,则X随后应置子于同它相邻的非四角方格之一,造成2子一线。若O在下一步中没有进行封堵,那么X就可造成3子一线的赢局。如果O进行了封堵,那么X应置子于一个四角方格,这个四角方格是同O的第二个子挨着的,并且同O的第一个子在格子线的同一侧。这样,X又有了一个2子一线。如果O在下一步没有进行封堵,那么X就可造成3子一线的赢局;如果O进行了封堵,则X置子于挨着O的第三个空格,又造成2子一线。如果O在下一步没有进行封堵,X就可形成3子一线而取胜:如果O进行了封堵,X只能把剩下的一个子放在留下的唯一一个格子中而形成和局。

 

上述例子说明,即使是对于非常简单的博弈,策略也可能是很复杂的。对于国际象棋,一个真实的策略庞大得永远无法被完整地写下来。地球上没有足够的纸和墨水列出所有的可能性,也没有足够的计算机存储器把所有这些可能性串起来,这就是为什么在人机对弈中计算机尚不能所向无敌的原因之一。

虽然实际的困难是如此之大,但是它没有难倒冯·诺依曼,因此也不能难倒我们。事实上,因为我们是有想象力的,我们可以再往前走一步。一个完全理性的游戏者不但可以设想出一个包含全部细节的策略(如果计算机的存储器或计算机的计算能力之类没有限制的话),他甚至可以在走第一步之前就预见到国际象棋的每一个可能的策略,并提前确定他应该做些什么。

假设你有一张国际象棋所有可能策略的列表,这些策略被编了号,从1到nn当然非常非常大),那么你对策略的选择就相当于在1~n中选定一个数。你的对手则从他手中所有可能性的列表(比如说从1到m)中也选定一个策略。一旦这两个策略被选定以后,整个博弈过程就完全被规定死了。通过应用这两个策略,你便可以移动棋子,并把博弈带到其预先设定的结果。开局,吃,出其不意的一招,终局……全都隐含在对策略的选择之中。

为了把这个“白日梦”做到底,我们可以这样想象:如果有足够的时间,你可以用每一对可能的策略去下一盘棋以观察其结果,这些结果可以列成矩形的表格。真正的表格大到可以伸展到银河系去,我们这里只能印出缩编的版本。

表3-1 黑方策略

一旦有了这张表、你就不必再对棋盘有任何烦恼。国际象棋的一次“对弈”无非是两个游戏者同时选择他们各自的策略,然后在表中查出结果。什么叫“同时”?黑方在确定其策略之前,不去看白方的第一步就叫同时吗?不!如果你这样想,那就是没有理解一个策略是多么庞大繁复。黑方策略的第一部分也许规定了对白方开局的可能的20步中每一步如何应对的开局走步。在冯·诺依曼看来,除非你对这20个偶然性中的每一个都通盘地考虑过对策了,否则你就不算已经有了一个策略。为了知道谁会赢,你必须在对应于白方策略的行和对应于黑方策略的列的相交方格中去找。假如白方在他的表中选取了2号策略,黑方在他的表中选取了3号策略,那么不可避免的结果就是白方在54步上将死对方。

这当然不是真的玩象棋的方法。要把每一种可能的偶然性都预先详细地列出来,将是“玩”的对立面——“烦”。但无论如何,用结果的表格来表示博弈这个概念是十分有用的。对于任何一种二人博弈,每一个可能的走步序列都可以用表中类似形式的方格来表示。这张表的行数同一个游戏者的策略数一般多,而列数同另一个游戏者的策略数一般多。化简为这样一张表的博弈被称为博弈的“规范化形式”。

博弈的技巧就在于确定选哪个策略。这张表把博弈的一切暴露无遗,但是单有这张表有时仍然不够。在表中结果如何排列是变化莫测的,每一个游戏者都无法选择他想要的结果,因为他要的结果要么只出现在行中,要么只出现在列中。对手的选择会做出相等的贡献。

再看国际象棋那张虚构的表。对白方而言,选1号策略是一个好主意吗?很难说。如果黑方选择1号策略,那么白方选1号策略是好的,因为这会导致白方赢。但如果黑方选择其他策略,那么结果可能是平局甚至是白方输。

如果白方真的想确定黑方准备选哪个策略,那么白方所要做的就是要确保在自己的策略中挑出一个与黑方策略匹配时能使自己取胜的策略。

不幸的是,黑方想做的是同样的事。黑方想摸透白方,并按照自己赢的结局去选择策略。当然,白方清楚这一点,并试图预测黑方基于他猜想白方如何做而采取什么行动……

博雷尔和冯·诺依曼认识到双方的这种冥思苦想使博弈超出了概率论的研究范围。假定对手的选择是由“或然性”确定的,那他们就完全错了。博弈同或然性无关,因为如果或然性在博弈中起作用,游戏者就可以期望尽力去压缩对手可能的选择,并准备好应对的策略。但是,实际上这是不可能的,因此我们需要一个新的理论。