正确的方法只有一种
罗纳德·费希尔通宵达旦地完成了他的成果——一篇题为《关于拟合频率曲线的一个绝对准则》的论文。他把文章发表在一份不重要的大学期刊上,然后耐心等待着,他确信自己会得到认可。
但事与愿违。他的同事中很少有人读过他的论文,而读过的人也觉得它无趣。对费希尔的同行来说,论文涉及的数学知识是微不足道的,他们没有理解其中暗含的信息——统计测量应该有一种正确的方法。对一个从十几岁起就凭借自己的智力频频获奖的21岁的年轻人来说,其他人的这种平淡的反应让他备感沮丧。
坏消息接踵而来。罗纳德·费希尔家境贫寒,父亲一度赚了些钱,但随后又一贫如洗。他的视力不好,这导致他没能如愿参加1914年爆发的第一次世界大战。他别无选择,只好去当小学老师。他极其厌恶这份工作。同事认为他冷漠无情,学生因为他不与他们交流而变得不服管教。他对自己的研究工作得到认可不再抱任何希望,他认为这都是因为人类愚蠢至极。他坚信,要解决这个问题,就必须繁育出更聪明的人类,提高人类的平均智商,创造一个全部由开明的人组成的社会。
就像今天愤怒的年轻人在网上聊天室讨论禁忌话题时可能会找到志趣相投的人一样,费希尔在为《优生学评论》等出版物担任编辑和撰稿的过程中也找到了志同道合的伙伴。聚会时,他抱怨说他的国家中“劣等人繁育的人口要多于优等人生育的人口”,而拯救人类的唯一途径是让具有“科学洞察力,尤其是充分了解人类卓越品质”的男性找到优秀的女性为伴侣并繁衍后代。他认为即将到来的战争甚至会帮助人类找到一条前进的道路,并指出“民族主义可能会发挥重要的优生功能”。愤怒和沮丧让费希尔迷失了自我。
费希尔的开悟源于他的一个最初看似奇怪且不切实际的决定:1917年,这位三心二意的学者决定做个农民。这是他展示男子气概的一种方式。在未能参战后,他相信他可以通过农田耕作所展示的力量和耐力来证明他对英国这个民族的价值。但费希尔最终的突破和成功并非源于他的辛勤耕作:他把经营农场的事务留给了怀孕的年轻妻子艾琳,还有她的姐姐——伦敦社交名媛杰拉尔丁·吉尼斯(费希尔称她为古德鲁娜,因为她长得像这位北欧女神),后者与丈夫离婚后,就跟他们一起生活并资助了费希尔的冒险行动。他的成功也不是直接源于他对动物、作物和牛奶进行的随意实验。这些实验只会浪费古德鲁娜更多的资金。他们的生活一度刚刚满足温饱,但费希尔还是花了100英镑(大约是当时平均年薪的一半)买了一台牛奶均质机,却根本用不上。
相反,他取得成功是因为他引起了洛桑实验站站长约翰·罗素爵士的注意。罗素希望能找到一位古怪的数学家来“检查我们的数据,找出我们漏掉的信息”。一个前剑桥“牛仔”和两个女人住在破败的农场里,仓库里堆满了古怪的实验设备,所有这些都与这份工作完美契合。于是,罗素为费希尔提供了一个研究职位。
现在切换到1919年洛桑实验站的下午茶场景。这个深受喜爱的传统是从W.布莱切利小姐成为那里的第一位女性员工时开始的,因为正如约翰爵士在向其他人介绍费希尔时所说的,“没有人知道该怎么对待女同事,但我们都认为她肯定喝茶”。
费希尔热衷于参加这些定期聚会。他蹲在地上,其他人则围在桌子旁喝茶。他衣衫褴褛,身体前倾,一边与人交谈,一边吞云吐雾。他会不时驱散同伴面前的烟雾,仿佛那些烟雾不是来自他的烟斗。他慢条斯理、滔滔不绝地谈论着他对一些微妙话题(尤其是种族问题)的看法,全然不顾身边还有严肃认真的年轻女性,她们已经尴尬得满脸通红了。
正是在这种情况下,费希尔问缪里尔·布里斯托尔博士要不要给她倒一杯茶。她拒绝了,说她更喜欢先倒牛奶。费希尔对此表示怀疑:“胡说,这肯定没什么区别!”周围人也开始劝说她,但布里斯托尔博士不为所动。她知道她能尝出味道有所不同。
费希尔根本无法在没有证据的情况下接受这样的主张,不管它是多么微不足道。于是,他和另一位同事威廉·罗奇(后来与布里斯托尔结婚了)一起组织了一项实验。
参加茶会的所有人都知道,仅用两杯茶测试是不够的。单凭运气,布里斯托尔博士就有一半的概率是正确的。罗奇提议进行一组配对测试,每次给她两杯茶,看看她是否每次都能发现差异。在这种情况下,她连续两次获得好运气的概率是1/2×1/2,即1/4。同理,她连续3次获得好运气的概率是1/8,连续4次是1/16。这当然是一个有效的测试。她不太可能仅凭运气就连续4次通过测试。
但费希尔并不满足,因为他希望找到最佳测量方法。他拒绝了罗奇的提议,而是让女服务员倒了8杯奶茶——4杯先倒牛奶,4杯先倒茶,然后随机地把它们放在托盘上。接着,他让布里斯托尔博士找出先倒牛奶的那4个杯子。
“这与我的方式究竟有什么不同呢?”罗奇困惑地问。毕竟,两种方法都使用了8杯茶。
费希尔回答说:“如果她不能正确分辨,那么她全对的概率现在变成了1/70,这远远小于1/16。这个测试方法更加严格,事实上,这是最严格的测试。”
为了理解费希尔为什么是正确的(再一次),我们可以考虑服务员摆放杯子的所有可能方式。当她摆放第一个杯子时,她可以从8个杯子中任意选择一个;摆放第二个杯子时,她有7个杯子可供选择,以此类推。这意味着摆放8个杯子有8×7×6×5×4×3×2×1=40 320种方式。其中一些摆法在某种意义上是相同的,因为先倒牛奶和先倒茶的杯子排出的先后次序是一样的。我们可以先计算出这些相同顺序的数量:摆放所有先倒牛奶的杯子有4×3×2×1=24种方式,同理,摆放所有先倒茶的杯子有4×3×2×1=24种方式。然后,做如下计算:
计算结果就是每种杯子排列方式出现的概率。如图1-1所示。
图1-1 如何测试布里斯托尔博士辨别某个杯子里先倒的是牛奶还是茶的能力
在所有可能的先后次序中,只有一个是正确答案,因此布里斯托尔博士只有1/70的概率说对所有4个先倒牛奶的杯子。也就是说,除非她真能分辨出味道上的差异……
她确实可以。令大家惊奇的是,她一个接一个地将4个先倒茶的杯子与4个先倒牛奶的杯子区分开来。布里斯托尔博士证实了她的这种能力。
费希尔否认布里斯托尔博士有这种能力的话是错误的。但在同事眼中,他证明了一件事:他们意识到,这位衣衫褴褛的数学家具有超群的实验设计能力,他的方法使他们的实验在开始之前就增加了成功率。罗纳德·费希尔的方法在洛桑实验站被广泛采用,随着时间的推移,外面的生物学家和临床医生也开始采用他的方法。因为费希尔研究的是非常实际的问题,所以他的天才之举终于得到了认可。但认可他的不是争论不休的剑桥数学家,而是全世界的生物学家。后来,一位美国统计学家打趣说:“费希尔教会了实验人员如何做实验。”
接下来,让我们回到5年后的今天。我们这部影片的男主角罗纳德·费希尔站在一大片麦田里,向一群年轻男女详细解释如何测量不同地块的产量。他会随机地为每个地块准备一个处理方案,以尽量减少偶然出现有统计意义的结果的可能性。令人振奋的音乐响起,镜头向后上方拉远,随后出现了一些实验和发现的剪辑,所有这些都是基于费希尔的想法才得以实现的。
罗纳德·费希尔的科学研究最终得到了应有的认可。他在洛桑实验站所做的研究,是当今包括微生物学和社会学在内的各个领域的科学家设计和实施实验的基础。他的“自然选择基本定理”成为进化生物学的基石,众多同行认为他对统计学理论的贡献在整个20世纪都是无与伦比的。1933年,他离开洛桑实验站,赴伦敦大学学院任教,后来又回到了他的母校剑桥大学。
年轻的罗纳德·费希尔是对的:正确的测量和处理数据的方法只有一种,它就隐藏在无数不正确的方法之中。