CHAPTER 1
第1章 引言:智能、人工和自然
人工智能并不新鲜,人类在发明和使用智能工具上至少已经有5万年的历史了。这里所谓的“新”更多体现的是如何在计算机上运行智能。当使用“智能”这个词时,我们通常指的是在学校所学到的那种高级的认知能力(cognitive functioning),但那种高级的智能是建立在现有的自然智能(natural intelligence)基础上的。通用智能则需要两者的结合。
当人们谈论“智能”时,通常指的是在学校学到的那种高级的智力能力,也就是逻辑和推理能力。阿尔伯特·爱因斯坦(Albert Einstein)基于其高超的智力而获得诺贝尔物理学奖便是这种智能的生动体现。
当人们谈论“人工智能”时,通常指的是在计算机上执行的程序。“人工智能”一词通常被认为是由约翰·麦卡锡(John McCarthy)提出的,他曾在1956年达特茅斯学院(Dartmouth College)举办的一个夏季研讨会上用过这个词,该研讨会旨在探讨如何让计算机模拟人类的智力能力。但人工智能比这更普遍,它是处理信息的一种有组织的系统化方法。处理过程是在机器上、纸上还是在大脑中执行并不重要。以“代数”这一典型的人工智能过程为例,它使人们能够系统性地思考,解决以前难以解决的数学问题。
系统化过程(systematic process)的发明至少在过去5万年里引导了人类智能的发展。这些过程就像计算机或宇宙飞船一样——它们都是人类发明的。正是它们让人类的技术过程在过去得以发展和繁荣。
另外,认为智能完全由这些高级智力行为组成的说法也是错误的。智能需要的远不止这些。爱因斯坦之所以被认为是天才,并不是因为他有系统地解数学方程的能力,而是因为他有创造新思想的能力,人们能从他的方程中获得对世界的新看法。例如,他最著名的方程——E=MC2,形式极其简单,求解过程一目了然,但它体现了一个非常厉害的思想,并持续在理论物理学中发挥重要作用。这个方程的主要思想就是,尽管能量和物质可以有明显不同的形式,但它们之间的关系是保持不变的。
爱因斯坦的才华不仅仅表现为对过去工作的逻辑重组,而是一个大的超越。他不仅从观测中推断出物理原理,而且还对其他可能的观测进行了预测。他的工作超越了他所知道的事实并预测出新的事实。人类的智能,包括爱因斯坦的智能,既需要一种逻辑类型的系统思维,也需要一种能够洞察事物的非逻辑类型的思维。
我们没有一个好的词汇来谈论这些互补能力。粗略地讲,我们可以一方面谈论直觉,另一方面谈论深思熟虑。可以谈论每个人都拥有的自然智能,以及需要教育和培训才能获得的人工智能。我们可能会讨论生物智能抑或计算智能。另一位诺贝尔奖得主丹尼尔·卡尼曼(Daniel Kahneman)则谈到了“思考:快与慢”(Thinking Fast and Thinking Slow)的问题。
人类的自然智能让婴儿在出生后的几小时内就能识别出母亲的脸,让我们可以穿过拥挤的房间或叠衣服。真实而自然的人类智能应该是非理性的、情绪化的,还有点亚符号(subsymbolic)特征。它可以只根据很少的证据而跳跃得出结论。
相比之下,人工智能让成年人能够以非情感的方式理性地思考和解决复杂的问题。人工智能往往是理性的、有条理的、符号性的(symbolic),但它也有局限性。人工智能提供的工具允许人们进行细致的推理,跟踪符号信息(symbolic information),解决量子物理等挑战性问题。
从逻辑的角度来看,自然智能会抄捷径。自然智能是人类许多弱点和怪癖的根源,但它也使人类能够在不迷失的情况下对动态变化的世界做出反应。
根据约翰·麦卡锡(John McCarthy)、马文·L.明斯基(Marvin L. Minsky)、纳撒尼尔·罗切斯特(Nathaniel Rochester)和克劳德·香农(Claude Shannon)的提议,达特茅斯夏季研讨会的目标是开展一项研究,以创造一种通用人工智能。这种人工智能能够形成抽象概念、解决问题,并改进自身。当时,他们认为实现这种通用智能的方法是尽可能精确地描述思维的本质,然后让一台机器来模拟它。
与会者表示,这次研讨会虽然没有达到它的最高目标,但仍然可以被描述为人工智能领域影响深远的里程碑。这也说明,即使在这么早期的阶段,与会者也专注于那些与高级认知功能相关的任务。他们认为智能是理性的、深思熟虑的、目标导向的。例如,艾伦·纽威尔(Allen Newell)、约翰·克利福德·肖(John Clifford Shaw)和赫伯特·西蒙(Herbert Simon)当时正在研究一个证明数学定理的程序,即“逻辑理论家”(Logic Theorist)。该程序旨在模仿成年人解决问题的技能——在这个例子中是一位数学家。他们的程序最终证明了阿尔弗雷德·诺斯·怀特黑德(Alfred North Whitehead)和伯特兰·罗素(Bertrand Russell)的《数学原理》(Principia Mathematica)著作中第2章所介绍的52个定理中的38个。而且,逻辑理论家所提供的一些证明甚至是新颖的。
赫伯特·西蒙曾对他的一群研究生说,他和艾伦·纽威尔在圣诞节期间“发明了一种能够进行非数值思考的计算机程序,试图解决备受关注的‘心身’关系问题[1],解释了由物质组成的系统如何被赋予‘心智意识’”。他们选择在计算机上通过定理证明方式来示范“心智意识”的想法是很有意义的,因为定理证明问题已经具备明确的定义,可以结合一些给定范围的基本事实或公理(如符号),通过有限的推导过程或运算(如符号替换)来一步步完成。事实上,他们所选择的这本《数学原理》著作,致力于证明数学的基本性质,所以书中已经很大程度上列出了可用于证明的各种公理以及和这些公理相关的运算,为推动其“心智模仿”研究提供了极大的便利。
事后看来,纽威尔、肖和西蒙的“逻辑理论家”研究是基于《数学原理》而开展符号逻辑探索的一小步,但在当时,却是计算智能(computational intelligence)领域的一次巨大飞跃。他们的方法对之后许多年的工作产生了深远影响。尽管怀特黑德和罗素已经列出了证明他们定理的步骤,但“逻辑理论家”并不总是遵循他们的方法。这很具有指导意义,因为它以新颖的方式对一些定理进行了证明。西蒙和他的同事高估了这一发现的重要性,但这成为计算智能发展的一个里程碑,而且该趋势仍在持续。
今天,我们的计算机系统可以玩游戏,诊断疾病,并执行其他超人类水平的任务。每一项突破性的成就都被预言为计算智能进化的下一个步骤,使得系统更接近通用人工智能的目标。如果我们有更强的存储能力和更快的处理器,最终将能够实现通用智能。
自这些早期发展以来,许多事情都发生了变化,但有两件事没有改变。一个是过度依赖一小部分过程(process)作为建立通用智能的必要和充分条件。20世纪50年代和60年代的智能计算机速度太慢,性能存在很大局限,所以研究人员只能解决一些小的示范案例或“玩具”问题(toy problem)。他们的错误在于认为规模和速度是将这些系统拓展到全面“类人智能”(humanlike intelligence)的唯一限制。
他们的另一个错误是认为其所研究的问题代表了实现通用智能所需要解决的全部问题。然而,他们关注的往往是这些问题的“玩具”版本,具有相对明确的问题定义和易于评估的具体解决方案。这类问题可以被描述为“路径问题”(path problem)。解决这些问题需要在系统所有可能“移动”(move)范围所构成的“空间”中找到一条路径。将一些走法组合起来就可以解决此类问题,而计算机的任务是在所有有效的走法中找出真正解决问题的具体路径。计算智能是找到解决问题所需的运算集及其顺序(路径)的过程。
用朱迪亚·珀尔(Judea Pearl)的话来说,这些问题的解决可以被简单地视为完成一些“曲线拟合”(curve fitting)练习任务。换句话说,要解决这些问题,需要找到一个将可用输入映射到期望输出的函数。这只是一种形成统计预测的方法。这个映射过程可能相当复杂,形成这种关系的选择或估计的数量可能令人生畏,但这仍然是目前所有计算智能系统所采取的形式。然而,并不是所有的问题都是这样,并不是所有的“智能”问题都是路径问题。
计算智能已经取得了巨大的进步,这些进步得益于天才的系统设计者们,他们恰好设计出了通过计算机所能够解决的系统。这些系统不需要通常也不用以与人类相同的方式来执行任务,因为计算机科学家已经找到了将它们简化为如同珀尔所称的“估计”(或拟合)任务的方法。它们可能在某些特定任务上比人类做得更好,但这并不是因为它们在那个任务上超越了人类智能,而是因为它们的设计者找到了其他途径来解决那些不需要类人智能来处理的问题。例如,美泰格(Maytag)洗碗机可以把盘子洗得比我自己用手洗得还要干净,但这并不能让它更接近于实现人类餐厅员工的智能。
这并不是说,能够诊断疾病、理解语音或驾驶汽车的机器学习系统不是智能的;它们是一种面向“特殊目的”的智能,而不是一般意义上的智能。如果我们要超越特殊目的的智能,就需要解决今天没有解决的问题。如果想要类人智能,则需要想办法用现有的工具来构建它,否则就必须建造新的工具。有一些研究尝试用现有的工具来创造通用智能,但到目前为止还没有一个成功。相反,更具有前景的方法是尝试理解和模仿人类是如何创造这种智慧的,因为人类是我们拥有的唯一的通用智能的例子。最终,机器的通用智能在其特定的方法上可能与人类的通用智能不同,但它必须在其能力范围内与人类的通用智能相似。