贝叶斯的博弈:数学、思维与人工智能
上QQ阅读APP看书,第一时间看更新

频率主义

统计误差理论的主角是卡尔·皮尔逊、埃贡·皮尔逊(前者的儿子)、耶日·内曼,尤其是罗纳德·费希尔。在 1920 年前后,这些天才统计学家建立了一套名为频率主义的思想框架,到今天,该框架已经进驻了所有科学学科。频率主义假设概率就是对频率的测量。对于频率主义者来说,要理解概率,首先要理解当样本数量变得足够大时,误差是如何消失的。

一如波普尔的哲学,频率主义者那诱人的想法首先在于方法的客观性。皮尔逊、内曼和费希尔对他们给出的方法特别自信,认为这些方法不仅严谨而确定,还能应用于所有问题。与频率主义者贬低的贝叶斯方法不同,频率主义方法不允许相信不同理论的人借助有问题的先验概率来歪曲实验结论。

频率主义哲学的核心内容之一,就是利用 进行统计检验的概念。统计检验就是对某个理论 的可信度的测试。对于频率主义者来说,他们对可信度做出某种预先假定。1 与波普尔的哲学相符的是,统计检验接下来就会尝试通过实验来否定理论 的可信度。我们把实验中收集到的数据称为 。如果数据 非常不可能在理论 中出现,那么频率主义者就会提议否定

1贝叶斯主义者会抬杠说这就是主观的先验概率!

实际上,如果我们尝试将这种推理翻译成更数学的说法,那么我们会发现这种方法有一个关于量级的缺陷:如果我们考虑非常精确的数据,那么这些数据都极不可能出现。确实,如果我得到了 ,但我的理论指出,得到的数值应该处于 0 和 1 之间,那么得到 这个确定到小数点后 10 位的数值的可能性就是五十亿分之一。所以我们应该否定这个理论。

为了使方法更合理,频率主义者提出,对于所有数据 ,都应该考虑理论 中比它“更不可能出现”的数据集合 。比如说,如果理论 指出我们应该得到的数据是 ,但我们得到的数据 却严格大于 0,那么“比 更糟糕的集合 ”一般就是比 还要大的所有数值的集合,或者说是与 0 的距离比 还要大的数据的集合。

赫赫有名的 值与我们考虑的理论 、数据 与统计检验相关,它的定义就是得到比 更糟糕的数据 的可能性。换句话说,我们可以写出以下公式:

更差

我们如果将它与贝叶斯公式比较,就能看到 值与我们在第 2 章谈到的思想实验项很相似,它测量的是理论 在什么程度上能够“很好地”解释观察结果。

从直觉上来说, 值越小,数据 似乎就与理论 越不兼容,而我们就更倾向于否定理论 。费希尔提出应该否定那些 值小于 5% 的理论。在今天,由于新技术让我们能够搜集十亿量级的数据,在某些物理实验中,数据甚至能达到千万亿量级,这时我们一般采用 0.000 03% 作为阈值。

无论细节如何,不可否认的是,费希尔的原则在 20 世纪下半叶带来了令人难以置信的丰硕成果。比如说在 2012 年,欧洲核子研究组织(以下简称 CERN)就宣布大型强子对撞机探测到了希格斯玻色子。实际上,如果要吹毛求疵,那么应该说 CERN 证明了,假设粒子物理学标准模型中的希格斯玻色子不存在的话,他们就极不可能观察到当前的观察结果。也就是说,在希格斯玻色子不存在的假设中,得到 CERN 的(或者比其更不可能的)观察数据的概率要低于 0.000 03%。这让 CERN 的研究者否定了希格斯玻色子不存在的可能性,或者就像媒体所说,他们就此接受了希格斯玻色子的存在性 [4]

频率主义者的方法统治了 20 世纪的科学,毫无敌手。特别是费希尔对此非常投入,他对贝叶斯公式发起尖锐批评,而且为了封锁所有反对其天才想法的意见采用了毒辣而顽固的手段,让所有本想与他的频率主义哲学一争长短的理论都变成了禁忌。他这样断言:“逆概率理论(也就是贝叶斯定理)建基于一个错误,应该被完全否定。”如果要把统计学的历史写成摩尼教式的小说 2,把纯粹贝叶斯主义者看作小说的主角,那么费希尔和其他所有频率主义者就是黑恶势力。

2摩尼教的主要教义是光明与黑暗的对峙。——译者注

话虽如此,但抛开他的傲慢、神经质和蔑视他人的性格,以及他对优生学和种族主义的坚信不谈,费希尔仍然是一位杰出的数学家,也是 20 世纪最有影响力的思想者之一。正因为他的严谨和才华,20 世纪的科学,特别是所谓的软科学取得了长足的进展,其可信度也大大提高。费希尔的统计学带来了巨大的好处。

尽管如此,纯粹贝叶斯主义者提出了许多反对意见。实际上,频率主义方法对她来说没头没尾。为什么要接受这种对可信度的假设?为什么要预先假设所有理论都有检验的价值?难道那些更简单或者结构更分明的理论就不能比其他理论更有前途?难道不应该同样考虑某个理论过往的成就?为什么要考虑那些比 更糟糕的数据?是不是必定存在一种自然的方法来确定比 更糟糕的数据的集合?为什么对某个理论的否定是决定性的?如果我们否定了所有理论,那应该怎么办?我们不是更应该对这些不同的理论进行比较吗?为什么要把阈值定为 5% ?0.000 03% 的阈值又是怎么来的?这些数值难道不是完全随意确定的吗?如果只有很少的数据,我们能得出什么结论?在只知道地球上有生命的情况下,应该怎样谈论生命?宇宙也只有一个,这又该怎么办?如何处理苏格兰黑色绵羊这个例子?