第2章 数学那不可思议的有效性
The Unreasonable Effectiveness of Mathematics
想象一下,如果在一次例行问诊中,你得知自己大概率患了癌症(90%的可能性),你会做何反应呢?我从未拿到过这种诊断,但如果收到了这样的诊断,我确信那一瞬间我的生活就将改变。所有眼前其他的顾虑、担心无疑都将变得不足挂齿,除非我的病能马上得到有效的治疗,否则我就可能过早死去,再也见不到我的家人或朋友。
现在再想象一下,如果在拿到诊断的几天之后,你得知医生其实在解读你的检测结果时出了差错,你患有癌症的概率其实只有10%,你会做何反应?在这种情景里,我敢肯定会感觉自己好像刚刚被宣布死刑然后又获得了赦免。我可能决心改变我的饮食或其他生活习惯以减少自己实际得癌症的风险——但另一方面,我想我会一如既往,如我第一次被误诊之前那般继续生活。
我编的这个由于医疗错误而导致不同后果的故事,是要说明数字可能会施加给我们生活的巨大影响。但这种情景并非完全是假想的。医生的确会误读癌症检测的结果——比你想的要频繁得多——不是因为测试不可靠或含混不清,而是因为他们不知道如何计算基本的概率。
你需要两条信息以估算一个检测结果阳性的病人患有癌症的概率:检测的准确程度,以及普通人群中患有这种癌症的比例。对于一个给定检测结果,你可能会预料到每一个医生都将给出大概同样的估计,尤其因为概率的高低可能决定着对病人的不同治疗方案。心理学家格尔德·吉戈伦泽尔(Gerd Gigerenzer),在柏林的马克斯·普朗克研究所适应性行为与认知中心工作,他发现,许多医生不能根据某项特定的检测结果正确判定病人患有癌症的可能性。 吉戈伦泽尔询问了多位有20~30年乳房X光照片经验的放射科医师(包括该科的负责人),当一位女性在一个有90%正确率的检测中得到了阳性结果,那么她患有乳腺癌的概率是多少?令人震惊的是,他们估计的范围从1%到90%都有。真正的概率是大约10%。
为什么医生有时会高估与阳性检测结果有关的癌症风险?设想你在玩一个如下图所示的转盘游戏,玩家轮流转动转盘指针,并且你希望轮到你转动指针时,指针将会停留在某一个灰色区域。如果你想计算这种情形实际发生的概率,你就需要数一数你能转到灰区的所有情况,然后与转盘上可能出现的所有结果总数进行比较。因为有3块区域是灰色的,而色块总数是9个,转到灰区的概率就是9中选3,或1/3。
现在,假设在计算转到灰区的概率时,你莫名忽略了所有的白区。在这种情况下,转盘上的分区总数只有6个(3个黑区与3个灰区),因此你会得出结论,说转到灰区的概率是6中选3,或1/2(比1/3高的概率)。虽然一个人在转盘上不太可能犯这种错误,但医生高估与检测阳性结果相关的癌症风险的方式,是与之相同的:他们忽略了去计算某些可能出现的情形。
假设你所做的癌症检测的准确率是90%,而在1000名女性中通常只有10个人会得乳腺癌。如果你恰好检测这10个人,那么平均会有9人的检测结果为阳性(因为检测的准确率为90%)。但这并不意味着当你的检测结果为阳性时,你患有癌症的概率便是90%。我们没有计算所有可能出现的情形。因为检测的准确率是90%,我们也需要考虑没有癌症的另外990人中,有多少人可能会出现阳性检测结果。这一过程中将有10%的概率出错。因此,990个没有癌症的人中大约有10%的人(或99人)将得到假阳性结果。这就意味着每1000个人参加检测,其中约有9+99=108人将出现癌症的阳性结果。但其实只有9个人真的患有癌症。因此,如果你的检测得到了一个阳性结果,那么你真正患有乳腺癌的概率只有大约8.3%,接近10%。
当然,90%与10%不过是数字而已。但当它们代表癌症检测的两种可能后果时,我们就很容易理解数值误差的实际意义。当真正的患癌风险不到10%,而医生告诉患者这个风险为90%时,可能会导致患者不必要地高度紧张,也会促使他们去寻求不太需要并且可能带来有害副作用的治疗手段。
因为数字是无形的,而且总是会在我们难以感知的尺度上展现它们错综复杂的功能——从病毒DNA中所刻的致命密码,到恒星中庞大的元素制造工厂——我们几乎不会注意到它们对我们日常生活的影响。但数字是我们存在结构的一部分。几乎在我们所做的每一个决定中,它们都占有一席之地——从我们(个人或国家)积累的债务数目到我们选择的抗病毒治疗方法。有许多理由告诉我们,为什么确保我们社会中每一位成员——
包括投票、承担工作、签署处方、充当陪审员、购买日用品、建造桥梁、协商合约、房贷、炒股、卖房、消费能源或养育孩子等涉及的每一个人——具备关于数字与数学的通用基本知识是明智的。