“以牙还牙”的致命弱点
经济学家对“以牙还牙”策略有一套不同的说辞。阿克塞尔罗德的研究成果先是以系列论文的形式刊载,然后结集出版于《合作的进化》这本书里,吸引了大众的想象力,又在媒体上得到广泛传播。光是这一点就足以让那些妒火中烧的博弈论家对这些成果表示鄙夷不屑,当然对他的抨击也很快就应声而起。
胡安·卡洛斯·马丁内斯-科尔(Juan Carlos Martinez-Coll)和杰克·赫什莱佛(Jack Hirshleifer)直截了当地说:“这样一个骇人听闻的说法竟然能被人们广为接受。所谓的‘以牙还牙’这种简单的互惠行为,不仅在阿克塞尔罗德设计的特定模拟情景中是最好的策略,并且还是个普遍现象。”他们说,人们同样很容易就能设定一个比赛的种种条件,让以牙还牙的策略发挥不了什么作用,而且,更让人担忧的是,好像根本就无法模拟出一个世界,让卑鄙的策略和友善的策略一起共存——而这其实才是我们生活的世界。[1]
肯·宾莫尔(Ken Binmore)是对“以牙还牙”策略批评得最不留情的一个人。他说,即使在阿克塞尔罗德的模拟实验中,“以牙还牙”策略也从来没有在与“更卑鄙”的策略的对阵中赢过单场比赛:所以,如果你进行的是单场赛,而不是巡回赛,那么使用“以牙还牙”策略就是个糟糕的选择,注意这一点非常重要。如果你在单场赛中使用“以牙还牙”策略,那你就是个十足的傻瓜。别忘了,阿克塞尔罗德是将很多不同策略之间比赛拿到的分数相加。“以牙还牙”策略是通过将很多高分和低分相加而最终赢得比赛,而不是在单局比赛中获胜。
宾莫尔认为,“我们发现‘以牙还牙’策略是很自然的想法——因为在内心深处我们都知道正是互惠原则维系着社会的运转。这个事实本身就让我们不假思索地欣然接受这一说法在数学上的合理解释”。他还说:“其实人们应该加倍小心,不要轻易接受从计算机模拟情景中推理出的普遍结论。”[2]
很多这样的批评都失之偏颇。我们不能因为阿克塞尔罗德没有抓住这个世界上发生的一切事情而对他横加指责,正如我们不能批评牛顿没有用万有引力定律来合理解释政治现象一样。大家都认为囚徒困境让人们对这个世界灰心失望,因为不仅背叛是合理的选择,而且没有认识到这一点的人就是傻瓜。但是阿克塞尔罗德发现,用他自己的话来说:“未来的影子”完全改变了这一切。简单而又友善的策略能一遍又一遍地赢得他所设定的比赛。即使他设定的那些比赛条件后来证明不切实际,即使生活并不完全是这样一场比赛,阿克塞尔罗德的工作还是彻底推翻了先前研究过这个问题的所有人的假设:在囚徒困境中唯一能采用的合理策略就是卑鄙无耻。善良的人最先完蛋。
至于人们所说的“以牙还牙”策略在得分高的比赛中失败而只通过累计积分赢得最后的胜利,这说到了问题的关键。“以牙还牙”策略在每一场小战役中失败或打成平局,但最后却赢得整场战争的胜利,主要就是确保在它所参加的绝大部分比赛中都能拿到较高的分数,这样它最后的得分就会最高。“以牙还牙”策略并不会嫉妒或非要打败它的对手。它认为,生命并不是一场零和游戏:我的成功并不一定要损害你的利益,双方都能在比赛中实现共赢。以牙还牙把每场博弈当成参与者之间的一场交易,而不是双方之间的一场比赛。
生活在新几内亚中部地区的高地人民,他们的部落之间亦敌亦友,关系错综复杂,充满了危险和不稳定因素,同时又互惠互利。他们最近开始踢起了足球,但是他们发现输掉比赛的压力太大,让人有点承受不了,所以他们干脆调整了比赛的规则。球赛会一直进行,直到双方都踢进一定数量的球才会结束。这样所有人都享受比赛的时光,却没有输掉比赛的球队,每个进球的球员都可以把自己当成比赛的赢家。这不是一场零和游戏。
有个初来乍到的牧师,看完一场这样的平局比赛后,对裁判抗议道:“难道你不知道?比赛的目的就是要想法打败对方的球队。必须分出胜负才行!”但是对方球队的队长不紧不慢地回答道:“不行,神父。事情不能这样干,至少在我们阿斯马特(Asmat)这里不行。如果有人赢了,就得有人输——这样绝对行不通。”[3]
这事之所以显得非常怪异,是因为这样的想法让我们本能上觉得难以接受,至少在比赛的情况下(我也怀疑这种新几内亚式的足球比赛有什么乐趣可言)。但是我们可以看看贸易的例子。对经济学家来说,在贸易当中所获的收益是双向的:如果两国之间增加贸易额,双方都会从中获利,这是不言自明的道理。但是对普遍路人而言,他们看待这个问题的方式就会截然不同,更不用说他们那些煽风点火的代表了。对他们而言,贸易就是你死我活的竞争,所以出口就是盈利,进口就是亏本。
我们可以设想一场足球赛,和新几内亚式的足球赛稍稍有所不同。在这场比赛中获胜的球队是进球总数最多的球队,而不是打赢大多数比赛的球队。现在假设有些球队还是按照以前的老规矩踢球,严防死守让对方进的球越少越好,同时自己踢进的球越多越好。而另外的球队则采用不同的策略——让对方球队踢进一球,然后自己再设法踢进一球。如果对方让他们进球,他们就会回报他们的好心,让对方也踢进一球,比赛就这样一直进行下去。你很快就知道哪支球队最后会取得最好的成绩:那就是采用“以牙还牙”策略的球队。这样足球赛就从零和游戏变成了非零和游戏。阿克塞尔罗德的成就正在于将囚徒困境从一场零和游戏变成一场非零和游戏。生命很少会是一场零和游戏。
但是,在很重要的一点上,宾莫尔和其他批评者说对了。阿克塞尔罗德过于匆忙地得出结论说,“以牙还牙”策略本身在进化论上是个稳定不变的机制——采用以牙还牙策略的民族面对采用任何其他策略者的入侵都会岿然不动。这个结论很快就受到质疑,通过进一步的电脑模拟比赛,就像阿克塞尔罗德的第三场比赛那样,罗布·博伊德(Rob Boyd)和杰弗里·洛伯鲍姆(Jeffrey Lorberbaum)向人们展示,很容易就能设计出比赛使“以牙还牙”根本无法获胜,这就极大削弱了阿克塞尔罗德结论的说服力。
简而言之,在这些比赛中,随意混合的策略之间相互争斗,通过它们在上一场比赛中所获得的分数(5分、3分、1分或0分)来取得相应的繁殖速度,最后获得对有限空间的控制权。在这些情况下,那些卑鄙的策略如“始终背叛”,一开始优势明显,尽情屠戮那些单纯合作的策略,将它们淘汰出局。但是很快它们就变得行动迟缓后继乏力,因为它们遇上的总是和自己一样的背叛策略,所以总是只能拿1分。现在才是“以牙还牙”策略大展身手的时候:和“始终背叛”策略对垒的时候,它很快通过背叛,让对手不止一次丢掉5分的背叛诱惑,但是,在和采用同样策略的同类对垒时,它却能采用合作方式拿到3分。所以,只要“以牙还牙”策略能够找到几个其他的同类,哪怕形成很小的合作团队,它们就能快速蓬勃发展,将“始终背叛”策略赶尽杀绝。[4]
但正是在这个时候“以牙还牙”策略的弱点开始暴露出来,比如“以牙还牙”策略经不起错误的考验。我们应该还记得,“以牙还牙”策略一直适用,直到它遭遇第一次背叛,然后它就会惩罚背叛者。当两个采取“以牙还牙”策略的博弈者遭遇,他们会愉快地合作,但是如果其中一方纯粹因为无心的失误而背叛一次,那么另一方马上就会打击报复,不久双方都会陷入可悲的相互背叛的循环中,彼此侵害,难以自拔。我们可以看一个活生生的例子。在北爱尔兰,爱尔兰共和军的枪手瞄准英国的一个士兵射击,却失手误杀了旁观的一个新教教徒,这场失误煽动了一场复仇的烈火,效忠英国的枪手可能会随机挑选天主教徒作为射杀对象,这当然又会引起一轮新的复仇,这样一直冤冤相报,无休无止。这样一系列的仇杀事件多少年来在爱尔兰早已尽人皆知,就叫“以牙还牙”的杀戮。
因为存在这样的弱点,“以牙还牙”策略之所以在阿克塞尔罗德设计的比赛里取得成功,显然大部分是比赛形式所起的作用。这些比赛恰好没有暴露出这类弱点。在一个难免犯错的世界,“以牙还牙”只不过是很平庸的策略,其他各种策略证明都要比它优越。那么阿克塞尔罗德得出的清晰结论瞬间变得阴云密布,只有精心打造的新策略上场才能廓清其阴霾。
[1] Martinez-Coll,J.C.and Hirshleifer,J.1991.The limits of reciprocity.Rationality and Society 3:35-64.
[2] Binmore,K.1994.Game Theory and the Social Contract.Vol.1:Playing Fair.MIT Press,Cambridge,Mass.
[3] Badcock,C.1990.Three fundamental fallacies of modern social thought.Sociological Notes No.5.审阅人的意见被Lyall Watson在1995年7月15日的Financial Times上引用。
[4] 最近,新的囚徒困境的博弈已经开始在空间中展开,而不只是在时间上展开,总之,它们强化了“以牙还牙”策略非常强大的这一印象。参看Hutson,V.C.L.and Vickers,G.T.1995.The Spatial struggle of tit-for-tat and defect,Philosophical Transactions of the Royal Society of London B 348:393-404;Ferriere,R.and Michod,R.E.1995.Invading wave of cooperation in a spatially iterated prisoner's dilemma.Proceedings of the Royal Society of London B 259:77-83。