第一章 作用量量子
1 平生最难事
柏林
1900年10月
曾有人劝告马克斯·普朗克,不要在理论物理学上耗费青春了,这个人就是他在慕尼黑大学时的导师。导师忠告他说,随着热力学原理的发现,物理学作为一门学科,已经基本完结了。简单来说,就是已经没什么可发现的了。
然而,随着20世纪的临近,物理学中一些对立理论之间却存在分歧。热力学原理强化了人们认为自然是一个和谐流动的流体的设想。能量既不能被创造也不能被毁灭,它在辐射与物质实体之间不间断地流动,本身就是一种不间断的连续体。原子论者的观点则与之对立,立场全然不同。原子论者认为物质不是连续的,而是由离散的原子或分子构成的。他们认为利用统计学方法,通过计算构成物质实体的原子或分子的机械运动,就能得出该物质实体的热力学属性。
普朗克精通经典热力学。原子论者的统计力学模型,从某些方面动摇了他的世界观,改变了他一生的研究。虽然普朗克也承认物质的原子论的确取得了一些显著成就,但他依然将其视作“进步的危险敌人”,最终“会因人们倾向于连续性物质的假设而不得不被摈弃”。
1897年,普朗克选择了“空腔辐射”理论,即我们熟知的“黑体辐射”,把它作为与原子论者立场对立的理论基础,也把它视为融合力学与热力学的一方土地。但仅仅三年后,普朗克的发现就逐渐使他倒向了原子论学说。与此同时,他的发现还静悄悄地埋下了一颗革命的种子,即将颠覆我们对世界的科学认知,而这几乎可以说是意外的收获。这场革命的持续影响,即便在一个多世纪之后,依然余威不减。
上述普朗克在原子论学说上遇到的问题,是一种简单叙述。原子论者通过把热力学量的计算还原为对原子或分子运动的数据统计,打开了一扇大门,但门内是一些令人不安的结果。在热力学中,某些无疑不可逆转的现象,以及不容反驳的自然规律,从统计学角度讲,则被认为只是众多不同选择中最具可能性的那一种。
对热力学第二定律的诠释,是矛盾的关键点。这是普朗克1879年的博士论文的主题,也正是对这个问题的研究让普朗克成为这一领域世界顶级的专家。热力学第二定律表述为:处于封闭系统中的物质,比如气体,与外界阻隔了能量的交换,那么随着系统内的气体达到热平衡,被称为熵的热力学量将不可避免地自发地增加到最大值。
熵是一个比较抽象的量,人们习惯将它解释为表示一个系统中的“混乱度”的量。1895年,经普朗克同意后,他的研究助理恩斯特·策梅洛(Ernst Zermelo)在德国科学杂志《物理年鉴》(Annalen der Physik)上发表了一篇论文,将论战的矛头直接指向了原子论者。
举个例子来说,如果我们在一个密闭的容器中,释放两股不同温度的气体,那么根据热力学第二定律,气体将混合,温度不断趋向平衡,混合气体的熵将逐渐增加到最大值。但是,根据原子论者的观点,混合气体的变化是每种气体中的原子或分子的机械运动造成的,混合气体的平衡状态只是其最可能的状态。而策梅洛则认为,这一点恰恰表明,原则上无法排除一系列能彻底逆转原子或分子运动的事件存在的可能性。如果这些事件真的发生了,那混合气体必然会分离,回到两者最初的温度,混合气体的熵会自发减少,这与热力学第二定律又是完全矛盾的。
原子论者的领袖,奥地利物理学家路德维希·玻尔兹曼(Ludwig Boltzmann)回应道:与对热力学第二定律普遍认同的诠释相反,熵并不总是增加,只是在绝大多数情况下增加而已。从统计的角度看,熵值高的状态数比熵值低的状态数多得多,这导致系统在更多情况下都处于高熵值的状态。玻尔兹曼认为,实际上,我们如果等的时间足够长,最终将会发现那些熵在自发减少的系统。
这个观点的神奇之处,就相当于聚会上的鸡尾酒杯摔碎了还可以自我复原,惊掉在场所有嘉宾的下巴。
对普朗克来说,这一点把对热力学第二定律的诠释逼到了崩溃的边缘。为了找到一个强有力的反驳,击碎玻尔兹曼的统计学解释,普朗克把战场转向了空腔辐射物理学。
这个选择,似乎是绝对安全的选择。毕竟,空腔辐射的理论物理学看起来与原子或分子没有丝毫关联。它关乎两个问题:一个是麦克斯韦理论中电磁辐射的连续波的问题;另一个则是热力学的问题,其第二定律使得辐射趋于平衡。普朗克认为,如果他能不借助原子论的统计力学模型就阐明平衡的过程,那他就可以摧毁热平衡力学描述的基石。
在当时,科学家对空腔辐射的特性已经有了相当的了解。加热任何一个物体到比较高的温度,它都会获取能量并发出光来。我们把物体加热后的状态称为“赤热”或“白热”。加热物体的温度越高,发出的光就越强烈,频率也就越高(也就是波长较短)。随着温度不断升高,物体开始呈现出红色,接着是橘黄,然后是明黄,再然后是亮白。
理论物理学家通过引进“黑体”,将此问题简单化。黑体是一个假想的、完全不反射光的(通体黑色)物体,能吸收并发出光辐射,对任何频率的辐射都一视同仁,不偏不倚。黑体与周围环境达到热平衡时,它发出的辐射强度与黑体内的能量总量有关。
理论物理学家进一步发现,如果一个空腔壁吸收效果非常好,且在壁上刺穿一个小孔(通过这个小孔,辐射可以进出),那么通过研究这个空腔内的辐射,就可以探索黑体的性质。早期的空腔辐射实验,大多使用陶瓷和铂制的封闭圆柱体,造价比较高。
1859年到1860年的冬天,德国物理学家古斯塔夫·基尔霍夫(Gustav Kirchhoff)证明,发射能量与吸收能量之比,只取决于辐射频率和空腔内部的温度,与空腔的形状、空腔壁的形状,甚至空腔的材质,没有半点关系。这表明,与辐射本身的物理学相关的某些基础性问题正一步步揭开面纱。基尔霍夫向科学界发起了挑战,看谁能最先发现这一行为的本质。
在此之后,物理学界取得了诸多进展。1896年,德国物理学家威廉·维恩(Wilhelm Wien)通过研究空腔辐射实验中发射出来的红外辐射(热辐射),推导出辐射频率与空腔温度之间存在一个相对简单的数学关系。维恩定律看起来具有相当高的可信度,1897年,汉诺威技术学院的弗里德里希·帕邢(Friedrich Paschen)通过实验,也进一步证明了维恩定律。然而在1900年,柏林帝国物理技术研究所的奥托·卢默(Otto Lummer)和恩斯特·普林斯海姆(Ernst Pringsheim)的实验结果却证明,维恩定律在低频率时并不适用。很明显,维恩定律还不是最终的答案。
1889年,普朗克接替基尔霍夫在柏林大学的职位,并于1892年晋升为正教授。无论怎么看,普朗克都不像一个科学革命先锋。他出身于牧师和教授的家庭,从小受到神学和法学的熏陶。在校时,他学习勤勉,英俊优雅,但并未显露出过人的天赋。他自己都觉得自己在物理学领域没什么天分,但最终却在学术界脱颖而出,蜚声国际。此时,他刚40岁出头,研究步调缓慢、沉稳而又保守,喜欢科学的稳定性和预见性,这也反映出包括他在内的德国上层阶级人士的普遍特点。后来据他自己说,他是一个有“和平倾向”的人,拒绝“一切可疑的冒险”。
普朗克住在柏林郊区的格吕讷瓦尔德,1900年10月7日,实验物理学家海因里希·鲁本斯(Heinrich Rubens)拜访了他,其间跟他谈了一些与同事费迪南·库尔鲍姆(Ferdinand Kurlbaum)共同实验的新成果,他们研究了低频率的空腔辐射。鲁本斯对低频率辐射特性的描述,让普朗克陷入了深思。鲁本斯离开后,普朗克继续埋头于自己的研究。他对维恩定律做了修正,最后得出的表述适合所有已知的实验数据,而这些修正,大部分都是靠某种灵光一闪的猜测得来的。
普朗克发现了他的辐射定律。
这一定律需要两个基本常数,第一个与温度相关,第二个与辐射频率相关。第二个常数最终用符号h表示,即后人熟知的普朗克常数。普朗克辐射定律中的这两个常数,当与光速和牛顿的引力常数结合起来时,似乎为所有物理量都提供了基础。关于这两个常数的作用,普朗克这样写道:“物理学常数使表述长度、质量、时间和温度的单位成为可能,它们是独立于特定物体或材料的,无论在何时、何种文化中,甚至对外星人和非人类来说,它们的意义都保持不变,因此可以被称为是‘基本物理计量单位’。”
普朗克随后给鲁本斯寄了一张明信片,上面写了新辐射定律的详细内容。在1900年10月19日的德国物理学会会议上,普朗克做了报告,向与会者介绍了新定律大致的推导过程。他宣称:“我之所以信心十足地让大家关注这个新方程,是因为从电磁辐射理论的角度来说,它是除维恩方程之外,最简单的方程了。”第二天,鲁本斯告诉普朗克,他把实验结果和新定律做了比较,证明“所有结果完全与新定律相符”。
似乎普朗克辐射定律就是最终的那个答案了,至少从实验结果看是如此。此时,普朗克转移了注意力,他要为该定律找出一个合适的理论基础,而这个任务让他经历了“平生最难熬的几周”。
普朗克把目光放在了电磁场与空腔材料中一组“振子”的相互作用上。这些振子的主要目的是,保证能量通过一个连续、动态的吸收与发射过程,在可能的辐射频率间保持适当的平衡。普朗克精通熵和热力学第二定律,他开始用辐射定律,就单个振子的内部能量和振动频率(会引发空腔内部相同的辐射频率),推算单个振子熵的表达式。就此他得出了振子熵的表达式,使用这个表达方式得出的计算结果与实验结果完全一致。现在他面临的问题是从“第一原理”中推算出相似的表达式,然后比较两者,得出适当的结论。
图2 (a)在三个不同温度下,根据普朗克辐射定律的预测和根据维恩定律的预测的对比。维恩定律在高频率(短波)上,准确再现了黑体辐射的行为,但在低频率(长波)上却不适用,在温度较高的情况下,不一致最为明显。(b)同样在三个不同温度下,普朗克辐射定律与瑞利—金斯定律的对比。频率很低(波长很长)时,瑞利—金斯定律接近黑体辐射的行为,但在紫外光这一段上,却出现了灾难性的差异结果
这个问题正是普朗克所说的“平生最难事”。普朗克估计试了好几种不同的方法,但他发现,他总是不由自主地回到同一个表达式,这个表达式与他的对手玻尔兹曼的统计方法很是相像。数学正引领他朝着一个他不想去的方向前进。
玻尔兹曼计算气体熵的方法是,假定将气体的总能量看成是一系列的“包”。最低的能量包设为ε,下一个为2ε,再下一个为3ε,以此类推。这样,能量不同的气体分子分布在不同的能量包之内,能量包中分子可能出现的不同分布方式的数量也可以计算出来。在这个分析中,能量本身保持连续性的变化。玻尔兹曼的所有工作就是把能量打包起来,然后以此类推从0到ε、从ε到2ε等能量范围内的分子数,进而计算出不同的排列组合的数量。
比如,假设一种气体只有3个分子,3个分子分别以a、b、c表示。我们假定该气体的总能量为4ε。把两个分子放入最低位的能量包ε,另外一个放入2ε中,就可以得出这个结果。可能会有几种排列组合方式呢?只有三种。我们可以把分子a和b放入最低的能量包,把c放入下一个,用[ab,c]表示。我们也可以把分子a和c放入最低的能量包,把b放入下一个,用[ac,b]表示。第三种排列组合方式就是[bc,a]。
根据玻尔兹曼的观点,气体最有可能的状态,是在可用的能量下,气体分子排列组合种类最多的那种状态,代表了那个能量下的最大熵值。通过使排列组合可能的最大数值与能量分布最可能的状态相等,就可以相对简单地计算出熵本身。
普朗克对抗玻尔兹曼观点的战争至少持续了三年,且普朗克一直处于失利状态。现在,他在这种必然面前缴械投降了。正如他后来解释的那样:“从那时起,也就是从它产生的那一天起,我就埋头其中,试图阐明‘新分布律’的真正物理特性,这个问题让我不自觉地考虑到熵和概率之间的联系,而这正是玻尔兹曼的想法。”
虽然黑体辐射的问题看起来与气体是否由原子或分子构成的问题风马牛不相及,但现在,普朗克向原子论者的统计方法伸出了手,并将其拿过来用。然而,其中大有玄机。由于他是先得出结果,再回头推算,因此他需要的统计方法其实与玻尔兹曼用的方法大相径庭。
与玻尔兹曼的统计分布相比,普朗克的统计分布存在一些细微的差别。玻尔兹曼检验的是在多个能量包中可分辨的分子的排列组合,而普朗克检验的,却是空腔构成材料的多个振子中存在的不可分辨的能量(我们继续用ε表示)的排列组合。比如,如果我们使用普朗克的方法将能量(4ε)分配到3个振子上,那么我们会发现存在15种排列组合方式。我们可以把所有的能量都放在第一个振子中,剩余的两个都没有,得出的排列方式为(4ε,0,0)。其他排列方式为(3ε,ε,0),(2ε,ε,ε),(ε,2ε,ε),等等。
此外,普朗克发现,若要得出他想要的结果,能量元素必须要与振子频率直接相关(由此也与辐射频率直接相关),这就是他如今广为人知的公式ε=hν(能量等于普朗克常数乘以频率)。他还进一步发现,能量元素必须固定为hν的整数倍。普朗克是循着一条与玻尔兹曼截然不同的路径,最终得出这些结论的。
许多年后,普朗克描述了他当时的心中所想:
简单来说,我当时的做法就是绝地求生。我本性偏好安宁,拒绝一切可疑的冒险。但那时候,在辐射与物质的平衡问题上,我已经斗争了六年都没有什么成果(自1894年起),我清楚这个问题对于物理学具有最根本的重要性……因此,必须不惜一切代价,找到一个理论解释。
此时,普朗克心甘情愿且满怀热忱地倒向了原子论。1900年12月14日,德国物理学会举行每两周一次的常规例会。下午5点刚过,普朗克就把自己最新推算出来的辐射定律在会议上做了介绍。他向与会人员解释道:“我们由此认为,能量是由确定数量具有相等有限大小的包裹组成的,这点是整个计算方法中的最核心之处。”1901年1月,他向《物理年鉴》提交了一篇论文。关于后来以他名字命名的物理常数,他是这样说的:
……由于它的量纲是能量和时间的乘积,因此我把它称作基本作用量量子或与能量元素hν相应的作用元素。
1900年12月14日是人们公认的量子革命开始的日子。实际上,普朗克此时还没有意识到他的公式ε=hν的重要性,但正是这个公式,动摇了经典物理学的结构。
据说,一次在格吕讷瓦尔德散步时,普朗克告诉他7岁的儿子埃尔温,他“觉得自己的发现可能是第一等的,或许仅次于牛顿的发现”。但这个说法的可信度值得怀疑。如果确有此事,那普朗克可能指的是他发现了辐射定律中第二个常数的性质——将其称为玻尔兹曼常数,用字母k表示——不是指发现了作用量量子和电磁辐射中的固定能量元素。
普朗克借助统计过程,将固定的能量元素分配到振子中,并没有过多考虑这一步会给物理学带来多大改变。如果原子和分子是真实的实体——这点普朗克此时也已准备接受了,那么在他来,能量本身必定是连续的,在辐射和物质之间不间断地来回流动。但在推导他的辐射定律时,普朗克不经意间引入了能量本身应是“量子化”的观点。这个观点贯穿在普朗克的演讲、论文中,但表意不清,没有任何评注,也没有引起任何关注。
只有真正的天才才能看到被其他所有人所忽视的内容。