一定要懂博弈论
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

囚徒困境:囚犯的两难选择

囚犯面对审讯,总是出卖同伙以求自保,于是囚犯陷入了困境,因为每个人都按自己的利益原则做事,即使夫妻之间也不能避免。丈夫与妻子往往“小吵”不断,要摆脱这种囚徒困境的局面,寻得博弈双方利益的一致,只有合作。

囚犯的两难选择

有一个让人耳熟能详的故事:

有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯,由地方检察官分别和每个人单独谈话。检察官说:“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况下无法串供,所以,假设每一个人都是从利己的目的出发,他们选择坦白交代则是最佳策略。因为坦白交代可以期望得到很短的监禁——3个月,但前提是同伙抵赖,显然要比自己抵赖而坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

假如他们在接受审问之前有机会见面谈清楚,他们一定会决定拒不认罪。不过,接下来他们很快就会意识到,无论如何,那样一个协定也不见得管用。一旦他们被分开,审问开始,每个人内心深处那种企图通过出卖别人而换取一个更好判决的想法就会变得非常强烈。这么一来,他们还是逃脱不了最终被判刑的命运,这就是博弈论里经典的囚徒困境的例子,又被称为囚犯的两难选择。

其实,许多人、许多企业,乃至许多国家,都曾经吃过囚徒困境之苦。看看生死攸关的核军备控制问题吧。每个超级大国最希望看到的结果都是另一个超级大国销毁核武器,而它自己则继续保留核武器,以防万一。最糟糕的结果莫过于自己销毁核武器,而别人却依旧全副武装。因此,无论另一方怎么做,自己一方仍然倾向于保留核武器。不过,它们双方也有可能一致认为,双方同时销毁核武器的结果会比一方销毁而另一方不销毁的结果更好。现在的问题在于决策之间的相互依赖性:双方一致希望看到的结果出现在各方都选择可能对自己不利的策略的时候。假如各方都有很明确的想法,打算突破有关协定,私底下发展自己的核武器,还有没有可能达成各方一致希望看到的结果呢?在这种情况下,只有其中一方进行思维方式的根本改变,才能推动世界回到裁减核军备的轨道上去。

囚徒困境的故事还体现了另一个普遍的现象:大多数经济的、政治的或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球和扑克是零和博弈:一个人的得就是另一个人的失。但在囚徒困境里,有可能出现共同利益,也有可能出现利益冲突;不招供的结果对两个囚徒都是有利的,而不是相反。与此相仿,在劳资双方的讨价还价中,虽然存在利益冲突,一方希望降低工资,而另一方要求提高工资,不过,大家都知道,假如谈判破裂而导致罢工,双方都将遭受更大的损失。任何一个关于博弈的有用的分析,都应该考虑到怎样处理冲突与利益同时存在的情形。我们通常将博弈游戏的参加者称为“对立者”,不过,你也要记住,有时候,策略可能将原本毫不相干的人变成一条绳上相互依存的两只蚂蚱。

那么如何才能摆脱囚徒困境呢?在下面的章节,我们还将探讨一些类似的方法,以及这些方法何时奏效,又是怎样发挥作用的。

囚徒困境下的利益原则

之所以会产生囚徒困境,是因为在囚徒困境的博弈中,每个局中人都以利益原则为第一参考因素。利益因素是人的本性,因为每一个人在博弈过程中都是自私的,甚至为了自己的私利,不惜一切代价,有句俗话叫“为达目的,不择手段”,说的就是这个意思。正是因为人的自私性,所以会在诸多事情上遇到囚徒困境的难题。因为每个人在涉及利益的根本问题时,往往不考虑别人,只考虑自己。人性对自己的考虑有时会冲出道德的底线,甚至让我们震惊。

以唐朝女皇武则天为例。武则天虽然是唐太宗李世民的才人,但因其美貌可人却深得太子李治的欢心。唐太宗临死之际,武则天不得不到感业寺做了尼姑。唐太宗死后3年,王皇后与萧淑妃争风吃醋,皇后想借武则天的魅力扳倒萧淑妃,所以便劝唐高宗李治把武则天再度接回宫里。

王皇后接武则天回宫也是为了自己的私利,她与萧淑妃的博弈中,谁也不肯与对方合作,以至于到了必须要把一方扳倒的局面,而此时的武则天成了王皇后博弈的一颗棋子。武则天既然参加到游戏之中,以她的个性,绝不居于人下。武则天开始代替萧淑妃成了这场宫廷博弈的局中人之一。

武则天聪明伶俐,对王皇后谦卑有礼,对唐高宗百般逢迎,不久被封为昭仪。王皇后想挤掉萧淑妃的意图也就很快实现了。但是,武昭仪既已扳倒了萧淑妃,接下来的一个目标便是要扳倒王皇后了。为了扳倒王皇后,武则天可谓费尽心机,最后竟以自己的亲生女儿的性命做赌注,来达到自己的目的。

利益驱使着每一个局中人不讲任何亲情,只是想一心实现自己的目标,尤其是武则天,可以说她就是一个理性经济人。

王皇后性情暴躁,对宫女们要求严厉。其母亲柳氏因贵为皇后之母,出入后宫毫不顾忌礼节,因此宫女们多有怨言。而武则天又总是乘机笼络王皇后的侍者,使这些侍者向武则天靠拢。宫人甘做武氏耳目爪牙,王皇后的一举一动,便都在武昭仪的掌握之中。无奈不论武则天怎样巧舌如簧,夸大皇后过错,劝高宗废掉王皇后,唐高宗始终不肯听从。因为唐高宗虽不喜欢王皇后,但绝无废后念头。机敏的武则天开始明白,劝说高宗废后是不明智的,必须让他亲自做出决定。

公元654年,武昭仪怀胎十月,满望生个儿子好继大统,不料生下的竟是个女儿。大失所望之后,武昭仪忽然想出了一个让唐高宗自己推断、下决心废掉王皇后的计策来。

一日,武昭仪在宫中闲坐,忽报皇后驾到。武氏便叫过宫女密嘱数语,自己却闪入侧室躲着。王皇后见武氏不在,便坐下等候,蓦听床上婴儿啼哭,就抱起来哄了一阵,待婴儿又睡着后才放回床上,离宫回到自己住处。

武则天见皇后已回,就从侧室出来,偷偷走到床前,咬牙将女儿掐死。

唐高宗每日退朝,必至武氏处谈情。不一会儿,即有使者来报皇帝驾临。武氏与平日一样,采花恭迎,谈笑献媚。过了一会儿,唐高宗对着床问武氏:“女儿还在熟睡?”武氏故意回答说:“熟睡已多时,现在该让她醒过来了。”便令侍女去抱起来。

那侍女启被一瞧,吓得半晌说不出话来。武氏故意催促:“莫非还在熟睡?赶快抱起便醒了!”那侍女才说了个“不”字,武氏故意装作不解,自己前去抱孩子,手还未碰及女婴,口中却已号哭起来。

唐高宗被弄得莫名其妙,走近床去仔细察看,才知道那活泼泼的宝贝女儿已变作一个死孩子,高宗难过得泪流满面。

武氏故意哭着问侍女道:“我往御花园采花,不过片刻工夫,好好的一个女孩,怎会被闷死?莫非你们与我有仇,谋死我女儿么?”

众侍女慌忙跪下,齐称不敢。

武氏又道:“你等若都是好人,难道有鬼来谋命么?”

众侍女这才恍然大悟,一片声道:“只有正宫娘娘到此来过,婴儿啼哭时她还抱起来哄逗了一会儿。小孩没声息时她才走。”

武氏顿时哭得泪人儿一般,慨叹自己命苦。唐高宗却已坚信王皇后下毒手谋杀了自己的亲生女儿,断然决定要废去王皇后。这时,武氏又故意说:“废后是件大事,陛下不可随便决定,尚需与大臣们好好商议。王皇后只是对妾不满,宁可逐妾也不能废后呀!”

然而,唐高宗自己推断的事,哪是他人可劝回的呢?他对武氏说:“朕意已决,卿勿再言!”

武氏表面一片茫然,内心却通明剔透,无比高兴……

中国是一个最重视伦理道德的国家,儒家一贯提倡父慈子孝、兄友弟悌,甚至还要扩展到政治领域,便是“忠”。历史统治者也大多标榜以孝治国,有的皇帝谥号之前总要加个“孝”字,如孝武帝等。可是,这种道德说教,在利益面前,有时仍显得苍白无力。

在博弈游戏中,利益本是无情物,化作利剑不认亲。

囚徒策略与懦夫困境

一旦陷入“囚徒困境”,任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。从一个故事的角度,我们会为两个囚徒不能合作而遗憾。然而在现实生活中,我们都巴不得他们互相指认,否则罪犯就逃脱了法律制裁;商家如果通过合谋控制物价,我们的生活水平就要打折扣。有一利必有一弊,其实我们完全可以把囚徒困境作为自己的一种行为策略。

现在我们作个假设,你正作为一名士兵身处第一次世界大战的战场。你们在战场上遇到了敌军。假设你们都不怎么爱国,那么活命是你的最高目标。

在战斗打响时,避免成为炮灰的最好办法就是逃跑,让其他人留下来战斗。

当然,假如你这边的其他人也跟着逃跑,那么你的逃跑就更显得明智了,因为当敌军打到你们这边时,你一定不希望只剩下自己在战斗。

因此,不管其他人怎么做,逃跑都是你所能采取的最佳策略。

但是,假如你这边的每个人都逃跑,那么你们大概就只有全军覆没了。

在这种情况下,类似囚徒困境的“懦夫困境”就出现了。

假如你这边的每个人都逃跑,敌军就很容易把你们一举擒获并加以歼灭。因此,与其每个人都逃跑,不如每个人都留下来更有利。

就个人而言,懦弱一点比较有利;就团体而言,勇敢一点对大家都好。部队自有打破这个懦夫困境的方法:在大部分的军队中,假如有士兵在战斗时逃跑,会被就地正法。因此,退缩就会被枪毙的压力反而对士兵更有帮助,因为这等于帮他们破解了懦夫困境。

古罗马有这样的军规,军队排成直线向前推进的时候,任何士兵,只要发现自己身边的士兵开始落后,就要立即处死这个临阵脱逃者。为使这个规定更可靠,未能处死临阵脱逃者的士兵也会被判处死刑。这么一来,一个士兵宁可向前冲锋陷阵,也不愿意回头捉拿一个临阵脱逃者,否则就有可能赔上自己的性命。

罗马军队这一军规的精神直到今天仍然存在于西点军校的荣誉准则之中。该校的考试无人监考,作弊属于重大过失,作弊者会被立即开除。不过,由于学生们不愿意“告发”自己的同学,学校规定,发现作弊而未能及时告发,同样违反荣誉准则,也会被开除。所以一旦发现有人违反荣誉准则,学生们就会举报,因为他们不想由于自己保持缄默而成为违规者的同伙。