智慧方程
对于纯粹贝叶斯主义者来说,所有知识哲学都可以归结为计算贝叶斯置信度。知识,就是对不同的理论赋予合适的置信度。有一个神奇的公式可以做到这一点,对,我说的就是贝叶斯公式,特别是它最基本的形式,我们真的可以把它叫作智慧方程,我认为它就是下面这个美妙的公式:
在这里, 表示我们考虑的理论, 表示已知的数据,而 代表所有 的替代理论。为了更习惯这个公式,你可以重读一下第 2 章。
我只能请你多花时间,一而再、再而三认真思考这个无比重要的公式。也请你想象一下,纯粹贝叶斯主义者会怎么利用这个公式回答她在面对波普尔哲学时提出的问题。
首先, 值在这里对应的是思想实验项 。这一项至关重要,它衡量的是理论预测观察数据的能力。然而,对于纯粹贝叶斯主义者来说,这只是公式的一部分。
另一个有着根本性意义的项就是先验概率 。这一项我们无法回避。我们将会在之后的章节中看到,这个先验概率让我们在日常生活中即使只能接触到极少的样本也能学习。更妙的是,我们还会看到在结合理论计算机科学之后,贝叶斯主义的先验概率就蕴含了奥卡姆剃刀法则,这个哲学原则断言越简单的理论越可信。
但最重要的是,公式中的分母叫作配分函数。这个分母等于 ,我们只是利用全概率公式对它进行了分解。这个分母的一部分就是分子本身,但配分函数还包含关于替代理论的类似项。也就是说,这个配分函数让不同的理论可以相互竞争,就此保证置信度的和总是等于 1。
当且仅当某个理论比对手可靠得多的时候,纯粹贝叶斯主义者才会向这个理论赋予相当高的置信度。意思就是,纯粹贝叶斯主义者不会仅仅因为某个理论可以解释某些容易解释的现象,就给这个理论赋予很高的置信度,在其他更简单的理论也能做出同样好甚至更好的解释时更是如此。反过来说,对于某些难以解释的现象,从纯粹贝叶斯主义者那里赢得最多置信度的理论不一定能完美解释这些现象,尤其是,在其他理论根本无法解释同样的现象时更是如此。
另一件需要强调的事情,就是所谓的“观察数据”是什么。这个变量代表的不是某个科学实验的所有结果,而是纯粹贝叶斯主义者在一生中可以得到的所有数据。尤其是,这意味着不能孤立地看待任何实验。
另外,尽管科学家用到了频率主义者的统计流程,但他们的思考基础更倾向于累积数据的贝叶斯哲学,而不是带有暗示性的所谓“科学方法”。正因如此,研究论文的开头都是一大段对过往文献的概述,用于证明这篇论文的贡献属于某个更广阔的研究领域。正如我们将在第 5 章看到的那样,科学家似乎更倾向于按照贝叶斯主义的原则而不是波普尔的哲学来思考。