博弈树
冯·诺依曼用树表示博弈的方法,其要点极为简单。它不但可以用于下棋,也可以用于任何博弈,只要博弈中没有任何信息是对游戏者保密的,也就是“所有的牌都是亮在桌面上的”。
大家熟悉的大多数博弈都可表示为游戏者走步的序列。在连城游戏、国际象棋、跳棋中,游戏双方总能看到棋盘的所有格子,没有任何一步是保密的。对任何一个这样的游戏,你都可以画出一张图来表示整个游戏所有可能的过程。我们这里以连城游戏为例,因为它最简单;但原则上,对国际象棋,跳棋或者任何这类游戏,你都可以画出这样一张图。连城游戏以第一个游戏者X在9个方格的任一格中放一个子开始,因此第一步有9种可能,这在图上以从某个点出发向上辐射出9条线表示。点表示走步,也就是做出决定的时刻,线表示可能的选择。
下面轮到游戏者O走步。还有8个方格是空着的,至于哪8个方格空着取决于X刚才将子放在哪个格子中。所以O要在9个第一级分支的每一个的顶端画8条代表第二级分支的线段。这就为X第二次走步留下了7个空格。当可能走步的图继续往上画时,它的分支就像枝杈簇生的一棵树。
当你继续这一过程时,在某一步上可能会出现3子一线的情况,这就是走该步的游戏者的赢局,同时也是图上该特定分支的终结,因为游戏就是在其中一人的3子成一线时结束的。我们把该点标记为“X胜”或“O胜”,并把该点称为图的“叶子”。
图上的其他分支以平局结束,把它们标记为“和局”。显然,连城游戏是不可能永远走下去的,最多只能走9步。所以,你偶尔会获得一张连城游戏的完全图。所有可能的连城游戏、所有曾经被人玩过或将要被人玩的游戏,在图上必然出现从“根”(X的第一步)出发的一个分支,并继续往上长,达到一个标有“X胜”或“O胜”或“和局”的叶子。对连城游戏而言,最长、最完整的分支是9步,最短的分支是5步(这是先走者赢的最少步数)。
关于树,我们就描写这么多,现在谈一谈剪枝的问题。通过消去的过程,你可以根据图形总结出“理性地”玩连城游戏的方法。上面描写的这个图中包含所有合法的走步序列,甚至包括那些愚蠢的走步,比如忽略了使对手形成3子一线机会的走步。你必须做的全部工作就是对树进行剪枝,就是把所有愚蠢的走步取消,只留下漂亮的走步,也就是用理性的方法玩游戏的走步。
图的一小部分看上去像下面那样:
图3-1
我们把图整个过一遍,并从每一片叶子出发仔细地回溯。每一片叶子都是某一方的最后一步,要么赢,要么成为和局。例如,在点A处,轮到X走步,只有一个空格,X别无选择,只好投子在这个格中,造成和局。
再看点B,这是游戏中此前的一步,轮到O走,他有两个选择,把子放在其中一个空格中导致进入前面提到的点A,结局必然是和。然而,如果O把子放入另一空格则导致X赢。O如果是理性的,必然情愿和而不愿意X赢。因此,在理性地玩游戏的情况下,从点B出发向右上方引出的分支永远也不会出现,应该把它从图中剪掉。一旦游戏进入B点,和局是必然的结果。
但是请看:X可能在此前的点C处就赢了,理性的X也许在点C处选择一种立即取胜的走步。所以,在上面这张图中,实际上整个左分支都可以被剪掉。
以上述方法一层一层往下剪枝直到树根,你可以发现,在理性地进行游戏(虽然方法不止一种)的情况下,只有一些平局是可能的结果。第二个游戏者能够而且将会消除X赢的任何企图;反过来,第一个游戏者也同样能够而且将会消除O赢的任何企图。
连城游戏中所能做的,几乎适用于所有无隐蔽信息的二人博弈。主要的限制是,博弈必须是有限的。即使博弈可以永远进行下去,在每一步上不同选择的数目必须是有限的,否则,就没有“叶子”(最后走步)供回溯了。
人总是要死的,所以没有一种娱乐性的游戏企图无休止地玩下去。但是,一些更具有挑战性的游戏的规则中很少会明确说明游戏的最大步数的。国际象棋通常以“将死”结束。但许多情况下,棋子可以无休止地走来走去而不会将死;也可能双方都把对方的子吃光了,使棋盘上只剩下两个王,但谁也不能把对方将死;在这种情况下,“和局规则”规定游戏结束。通常,当若干棋步的序列重复3次时,规则就宣布游戏为和局。另一个更为严格的规则规定,如果在40步之内双方都没有走兵,而且没有比兵的级别更高的棋子被吃,则以和局结束。
因此,冯·诺依曼和莫根施特恩指出,在给定和局的规则之下,国际象棋的总走步数是有限的。(在典型规则下,大约是5000步,远多于曾经出现过的其他任何棋类游戏!)对于证明最佳策略而言,极限的实际数值并不重要,只要知道它存在,而且是个有限值就行了。在知道国际象棋最多只能走这么多步,而且每步中可供选择的走法的数量也是有限的情况下,结论自然就出来了:游戏本身有多少不同的进程,其数量也是有限的。你可以为游戏的所有合法进程画一张图,然后对它进行剪枝,以揭示下棋的理性化方法。
这里我们想起一则关于下棋的古老的笑话:白方走了第一步以后,黑方立即说:“我放弃”。两个完全理性的人下棋很可能就像这则笑话那样平凡,这只是因为我们不知道下棋的正确策略。也正因为如此,下棋对棋迷们来说是如此有挑战性。证明最佳策略存在是一回事,完成所有计算从而获得最佳策略则是完全不同的另一回事。那么,一局理性的国际象棋比赛将以某一方胜利(最大可能是白方,因为他先走)结束呢,还是以和局结束呢,这是无法预知的。