贝叶斯的博弈:数学、思维与人工智能
上QQ阅读APP看书,第一时间看更新

蒙蒂·霍尔问题

现在我们来考虑蒙蒂·霍尔问题。这个概率论经典问题的灵感来自 20 世纪 60 年代由蒙蒂·霍尔主持的一个叫作《达成协议》(Let's Make a Deal)的美国电视游戏节目。在节目的最后,参赛者必须在三道门帘中选一道。其中一道门帘之后有一辆汽车,其余两道门帘后面是山羊。参赛者选择之后,蒙蒂·霍尔会增加悬念:在参赛者没有选择的门帘之中,至少有一道门帘背后是山羊。然后,蒙蒂·霍尔会将这道背后是山羊的门帘打开。

现在剩下两道门帘,其中一道后面有汽车,另一道后面则有山羊。这时,蒙蒂·霍尔就会向参赛者提出一个新选择:他可以维持自己的选择或者换一道门帘。这位参赛者应该怎么做?他应该遵循一开始的直觉,还是应该改变主意?

跟“钓鱼”学生的谜题一样,我们似乎又落入了去掉一种可能性的相似情况中。我们倾向于认为汽车的所在位置仍然是等概率的,是否改变主意并不重要。

如果你就是这么想的话,要知道在你之前许多顶级数学家都犯了跟你一样的错误。蒙蒂·霍尔问题难倒了很多聪明绝顶的人。1990 年,当玛丽莲·沃斯·萨万特在美国《大观》(Parade)杂志中给出这个问题的正确答案时,一万名读者给杂志写信,断言沃斯·萨万特搞错了,其中一千名读者还持有博士学位。

即使是著名数学家埃尔德什·帕尔,也就是数学史上发表论文最多的人,也不相信沃斯·萨万特的严谨证明。只有在看到模拟结果之后,大为惊讶的埃尔德什才认输。大数学家埃尔德什也不理解贝叶斯公式,他也不是唯一一个不理解的人。

我是在 13 岁的时候遇到蒙蒂·霍尔问题的,我当时并不知道贝叶斯公式。但有一个论证既有足够的说服力,又能让我理解。其实,在选择一道门帘之后,如果你知道自己不会改变主意,那么接下来的结果就像蒙蒂·霍尔没有增加悬念掀起有山羊的门帘那样。你选到汽车的可能性,也就是一开始选择的门帘后面有汽车的概率,等于 1/3。所以如果你不改变主意的话,那么赢的概率就是 1/3。奇怪的是,这个结果说服了我,但我还是不能计算改变主意之后赢的概率。

如果你维持选择却输了的话,也就是说,未选择的门帘背后就是汽车,即蒙蒂·霍尔建议你改主意选择的那道门帘,那么实际上发生的事情是,三次中有两次你一开始选择的门帘后面是山羊。在这种情况下,当只剩下两道门帘的时候,汽车必定在另一道门帘背后。如果你改变选择就能赢,三次中赢两次。

这里的数学原理毋庸置疑。你换一道门帘就能使赢得汽车的可能性加倍!与那些没有花心力慢慢仔细思考这个问题并保留最初选择的人相比,纯粹贝叶斯主义者赢得汽车的可能性是他们的 2 倍。

如果你还没有被这个论证说服,那么我请你以埃尔德什为榜样,自己做个实验。在英国广播公司(BBC)的一部出色的纪录片中,数学家马库斯·杜·索托伊向喜剧演员阿兰·戴维斯提出了蒙蒂·霍尔问题。一脸怀疑的阿兰·戴维斯相信,在重复进行的蒙蒂·霍尔游戏中不改变门帘的选择会有优势,跟绝对会改变的马库斯·杜·索托伊正好相反。在 20 次尝试中,阿兰·戴维斯只赢了 2 次,而马库斯·杜·索托伊赢了 16 次。当然,这些数字似乎不符合贝叶斯理论预言的 1/3 和 2/3——这都是小数定律 1 的错!但好处就是这说服了阿兰·戴维斯自己错了,或者说他至少做到了这一点,因为他似乎并没有明白马库斯·杜·索托伊的解释。

1小数定律是对大数定律的一种戏仿。大数定律说的是某个事件在重复足够多次后,出现的频率会趋向于事件的概率。而小数定律可以说是人类在认知中对大数定律的一种误用:即使在事例数量较少,不符合大数定律前提的情况下,人们也会认为可以应用大数定律,认为事例足够有代表性,轻率地就此做出结论,而不考虑例子数目不足导致错误的可能性。——译者注

这一局过后,阿兰·戴维斯只是丢掉了一点尊严,要是他知道就连鸽子对蒙蒂·霍尔游戏的理解都比他更正确的话 [1],那他丢掉的尊严就可不止这一点点了。有时候,“误解”贝叶斯公式会导致更严重的后果。萨莉·克拉克就为此在人生中付出了最惨重的代价。