第5章 人工智能:昨日成就与今日现状(1)
首先,我们回顾过去。在最长的时间范围里,历史似乎呈现出一系列不同的增长模式,每个新模式都比前一个模式增长更快。根据这个规律推测,可能会出现另一种(甚至更快速的)增长模式。然而,我们并不特别强调这个观点,因为这并不是一本关于“科技加速”、“极速增长”,或者集合在“奇点”标题下的各种观点的书。然后,我们要回顾人工智能的历史,之后再探索目前人工智能的能力。最后,我们简要地介绍一些专家近期的观点和调查,并且思考一下我们对于未来发展之时间表的空白领域。
增长模式和宏大历史
仅在几百万年前,我们的祖先还在非洲森林中穿梭。以地质或进化的时间尺度来看,从与类人猿共同拥有的最后一代祖先向智人的进化是非常快速的。我们进化出直立的姿势和对生拇指,而最重要的是,我们的大脑体积和神经组织发生了相对微小的变化,但正是这些变化引起了人类认知能力的巨大进步。因此,人类可以进行抽象思维,交流复杂的思想,可以比地球上任何其他物种更好地积累和传承文化信息。
这些能力使人类创造出越来越高效的生产技术,从而使我们的祖先从热带雨林和草原向远方的迁徙成为可能。尤其是进行农耕之后,人口总数和人口密度都在增加。更多的人口意味着更多的想法;更大的人口密度则意味着想法更容易传播,并且更多的个体可以专注于发展专门的技能。这些发展提高了经济生产力和技术实力的增长率。后来与工业革命相关的发展则带来了第二次与此相当的增长率的剧增。
这些增长率的变化有着重要的影响。几十万年前,在早期人类(或原始人类)史前时代,增长非常缓慢,要使人类生产能力增长到能够维持另外100万人基本生存的水平,需要大约100万年的时间。到了公元前5000年,经过了农业革命,增长率已经提高到只需要两个世纪就能实现同样的增长。今天,经过了工业革命,世界经济平均每90分钟就能够增长相同的量。
即使是现在的增长率,如果持续一定时间,也会产生可观的结果。如果世界经济继续以过去50年的速度增长,那么到2050年,全球财富将是现在的约5.8倍,到2100年则是约35倍。
然而,当前这种依指数增长实现稳定繁荣的方式仍旧是不够的,如果世界再经历一次农业革命或工业革命那样的飞跃式增长,世界将会呈现出完全不同的面貌。经济学家罗宾·汉森通过研究历史上的经济和人口数据,推测出过去社会中经济呈倍数增长所要经历的时间:在洪积世狩猎采集社会下,经济增长翻倍需要224000年,在农业社会需要909年,在工业社会则需要6.3年。(在汉森的模型中,当今时代是农业社会和工业社会发展模式的混合体,世界经济实现倍数增长的速度还不能达到6.3年这个平均时长。)但如果出现另外一种完全不同的经济增长模式,类似于农业革命和工业革命时期的飞跃式发展,那么世界经济便会以每两周的时间实现翻倍增长。
以当今形势看,要实现这种增长速度无异于痴人说梦。观察家们可能已经发洪积世(Pleistocene),又译更新世,地质时代第4纪的早期。—译者注现,对于以往的历史时期而言,世界经济很难在某一段时期中实现好几次翻倍增长。然而,我们现在就要学着对这种不寻常的情况习以为常。
弗诺·文奇(Vernor Vinge)开创性的文章以及雷·库兹韦尔(Ray Kurzweil)等人的著述所揭示的那种即将到来的技术性奇点已经受到了广泛关注。然而,“奇点”这一术语在很多不同领域被混乱地使用,并催生出一种不合理的技术乌托邦氛围,就好像我们会就此迎来太平盛世了。考虑到“奇点”这个词所指的大部分涵义与本文的论述不甚相关,我们可以去掉这个词并代替以更精确的术语,以便阐述得更清晰。
我们更感兴趣的一个与“奇点”相关的术语是智能爆发,尤其是机器超级智能的前景。肯定会有人意识到增长模式是比农业革命和工业革命还要激烈的另一种可能的飞跃式增长模式。这些人也会意识到,要想让世界经济实现在仅仅数周内翻倍的增长速度,就需要创造出一种比人类的生物性思维更快、更有效的思维方式。但是我们很难通过分析经济增长曲线以及推断过往经济增长模式来认真严肃地了解机器智能变革的前景。我们将看到,更加强有力的理由会让我们认真考虑这一问题。
大预期
自20世纪40年代计算机被发明出来之后,机器就一直被寄予厚望,人们希望机器能够具备人的一般智能,更确切地说,就是机器要具备普通判断力和有效的学习、推理能力,并且要能够制订计划以应对复杂信息处理过程带来的挑战,这种挑战可能来自自然和抽象领域的各个方面。在计算机刚面世时,人们就期望能够在未来20年之内赋予计算机人工智能。但一年又一年过去了,实现让机器具备人工智能的日期却一拖再拖;以至于今天,关心人工智能的未来学家们依旧普遍认为智能机器的出现还需要20多年。
在谈到彻底变革所需要的时间时,预言家们总喜欢用20年这个时间跨度:这个时间跨度既抓眼球,又足够长,长到可以让一个目前看起来还是模糊想象的突破成为现实。为什么不是更短的时间跨度呢?因为大多数在未来5~10年内可能对世界产生重大影响的技术目前已经在小范围内被应用了,而全新的技术在不到15年之内就能让世界焕然一新,当然这也只是一个理论假设。另外,之所以喜欢说20年,还有可能是因为一个预言家的职业生命大概就是这么长,这样一来他在做出大胆假设时也不用承担名声受损的风险。
然而,即便一些人在过去对人工智能的预言不准确,这也并不意味着人工智能就是不可能或者永远无法实现的。那么,为什么人工智能的发展总是落后于预期呢?这主要是因为创造人工智能机器所遭遇的技术困难远远超过了先驱者们认为的程度。但这也只是说明我们遇到了多大的技术难题以及我们离解决这些难题还有多远。很多时候,一个最初看起来复杂得不可救药的难题往往在后来都会意外地被非常简单的手段所解决,当然,用复杂的手段解决难题更为常见。
在下一章,我们将会看到那些可能实现与人类相同智能的人工智能的具体路径。但我们在一开始就需要注意一点,那就是如果我们将实现人工智能视为一辆火车所要到达的站台,那么不管我们现在与将要到达的站台之间有多少临时停靠站,实现与人类智能相同的机器智能也并不是终点站。顺着这条道路再往前走,下一个站台就是机器智能超越人类智能。这列火车不会在达到人类智能水平这一站就停滞不前或者减速行驶,它很有可能会飞速而过。
第二次世界大战时期,阿兰·图灵密码破译小组的首席统计师兼数学家I·J·古德大概是清晰阐述人工智能未来图景的第一人。在那段写于1965年、后来被经常引用的名言中,他这样写道:
我们把超智能机器定义为具备超越所有聪慧人类智能活动的机器。考虑到设计机器是智能活动的一部分,那么超智能机器甚至能够设计出更好的机器。毫无疑问,肯定会出现诸如“智能爆发”这样的局面,人类智能会被远远地甩在后面。因此,第一台超智能机器将是人类创造的最后一台机器,当然前提条件是这台机器足够听话并告诉我们要怎样才能控制它。
目前存在的显著风险便与这个智能爆发相关,我们必须以最严肃的态度审视这一风险,即使我们知道(实际上我们并不知道)出现这一风险的可能性非常小。但是尽管人工智能的先驱者们相信与人类智能水平相当的人工智能所存在的危害,大多数人也并不认为人工智能会有超越人类智能的可能。他们脑海里存在着这样的固有观念,即就算是机器能够达到人类的智能水平,也不能因此就推断出机器最终会发展成超越人类智能的超智能机器。
人工智能的先驱者们大多数时候都不认为他们的事业可能会存在风险。至于创造人工智能以及具备人工智能的计算机霸主是否会存在任何安全隐患或者伦理风险,先驱者们才不会在这些问题上面多费唇舌,更别说去严肃思考了。即便是在当今这个不怎么批判技术使用过程中所存风险的社会背景下,这种缺失也让人备感诧异。我们当然希望这些先驱者们的事业最终能够成功,但我们要的不仅仅是娴熟的技术以引燃智能爆炸,我们还要能在更高水平上掌握控制权,以免我们在爆炸中身首异处。
而在瞻望未来之前,对于机器智能历史的飞速一瞥对我们而言还是颇有助益的。
希望与绝望并存
1956年夏天,10名研究神经网络、自动化理论以及智能的科学家们在达特茅斯学院组成了一个为期6周的工作组。这个达特茅斯夏季项目经常被认为是人工智能研究的第一缕曙光。大多数参与者后来都成了这一领域的开创性人物。项目组成员的乐观预期在给项目资助方洛克菲勒基金会提交的一份报告书中展现得淋漓尽致:
现报告我们10人团队经过两个月针对人工智能的研究成果……这项研究建立在这样一个设想的基础上,即智能所能实现的学习或者任何其他方面的特征在理论上都能够被机器精确地模拟出来。该研究尝试去发现机器是如何使用语言、形成抽象思维与概念、解决人类所面临的问题以及学会自我改良的。我们认为由这些精心遴选出来的科学家们组成的团队在经过一个夏天的研究后,能够在其中一个或者几个问题上实现突破性进展。
距离这一大胆的开创性研究已经过去了60年,人工智能在这60年中跌宕起伏,既经历过大肆宣传、野心勃勃的高潮期,也遭遇过挫折满满、令人失望的低潮期。
达特茅斯会议激发了人工智能的第一次研究热潮,该项目的主要组织者约翰·麦卡锡说这一时期是一个“看,我能办到!”的时代。在这一人工智能发展的早期时代,研究者们建立起各种系统以批驳那些认为“机器不能做‘某事’”的怀疑论。这类怀疑论在当时非常流行。为了对抗这种怀疑论,人工智能研究者们在某些微观领域创造了小型系统去实现具体的“某事”,以便证明机器是能够做“某事”的。这些微观领域往往被完全限制在某个非常具体的范围内,使得演示简单的机器性能成为可能。比是早期的逻辑思想家的这类系统便可以证明怀特海和罗素那本《数学原理》(Principia Mathematica)第二章中的大多数定理,而逻辑思想家的证明过程甚至比原来的证明更加简洁,这驳斥了那种认为机器“只会数数”的想法并显示出机器也能够进行推理和逻辑证明。在这之后又出现了通用问题解算程序,这种程序在原理上能够解决很大范围内的专业问题:既有能够解决大学一年级课本里微积分问题的程序,也有能应用于某些智商测验中解决图像类比问题的程序,还有能写出简单代数语言的程序。Shakey(意思为摇摆)机器人的出现显示出逻辑推理能够与知觉结合在一起,并可以应用于设置和控制肢体动作,其之所以被叫作shakey,是因为这种机器人在演示时总是不停抖动。ELIZA程序则展示了一台计算机是如何模仿罗杰斯这类心理治疗师的。在20世纪70年代中期,SHRDLU系统演示了一只模仿人类的机器人手臂是如何在摆放着几何物体的世界中,遵循使用者用英文打出的指令行事并且回答其输入的问题的。在之后的10年中,相继出现了各式各样的系统程序:能够以多个古典音乐作曲家的风格创作曲子的系统,在特定的临床诊断中表现得比初级医师还要好的系统,能够自动驾驶汽车的系统,以及能够发明专利的系统。有的系统甚至还会说笑话。
但在早期的演示系统中取得成功的这种方式却被证明很难向更广泛的领域延伸,也很难解决更难的问题。原因之一在于常用的穷举法很难解决可能的“组合爆炸”的问题。穷举法可以解决简单问题,但是只要问题变得稍微复杂一些,这种方法就没有用了。例如要证明一个有5步推理、一个推理规则以及5条公理的定律,便可以简单列举出3125种可能的组合方式,然后挨个试验并寻找那个能够推出预期结果的组合。穷举法也可以运算6步或者7步的推理。但是随着任务变得越来越复杂,这种穷举法便很快遇到了瓶颈。要证明一个有50步推理的定律,工作量可并不是证明5步推理定律工作量的10倍,如果用穷举法的话,就可能需要550≈8.9×1034种可能的组合,即使是对于最快速的超级计算机来说,这也是不可能实现的计算。