前言
从Walter的海龟机器人开始,技术已经发展了很长时间,我们现在能够为拥有ASIMO、PR2、NAO和Pepper这样先进的机器人而自豪。我对这个研究领域很有兴趣,这归功于我的学术背景,我曾经参与的各种开源机器人社区(Player/Stage、ROS、MORSE等),还有我的教学任务以及与学生一起进行的项目。最重要的是,我像孩子一样渴望制造机器人。我不能自拔地把过去十年学到的几乎所有东西都凑在一起,就像我们知道的那样,机器人技术和人工智能确实能改变我们的世界。在全书十章的内容里,我对各种各样的研究者进行了思考,如Braitenberg、Dennett、Brooks、Arkin、Murphy、Winfield、Vaughan、Dudek、Dorigo、Sahin、Bekey、Abney、Wendell、Takeno、Bringsjord和Anderson夫妇,这些让我印象深刻的人为我展现了通往正确道路的夺目光辉。除了这些学术上的影响和激励之外,科幻小说,特别是艾萨克·阿西莫夫、Philip K.Dick、Arthur C.Clarke、Cory Doctorow、Peter Watts等人的作品,指引我去研究人工智能和机器人的各个方面以及它们对人类社会的影响,并帮助我在本书中阐述想法。
此外,我还受到了一系列电影的影响,这其中有标志性的描述机器人的电影如Wall-E、IRobot,以及经典电影如The Metropolis、Blade Runner和West World,还有最近的Interstellar、Real Steel、Robot and Frank、Big Hero 6和Ex-Machina。
本书致力于向读者介绍在过去四十年中基于智能体的机器人所取得的成就,以及使用易用的电子和开源工具实现这些概念的方法,也介绍了多机器人团队、群体机器人和人机交互,以及在机器人技术中开发人工意识方面做出的努力。最后一章通过超级人工智能和技术奇点的预言展望了人工智能和机器人技术的未来。
本书的旅程从古希腊神话开始,以一个关于未来预言的争论结束,即人类和技术将融合在一起以创造出高等生物作为我们进化途径上的继承人。从赫菲斯托斯、Philon、达·芬奇、特斯拉、Walter、Toda、Moravec、Braitenberg、Brooks到库兹韦尔,本书采用了实例、图片、与专家一对一的访谈、图解、漫画等方式,内容生动活泼。
本书共涵盖如下七大主题。
1.人工智能与应用人工智能
任何学科的理论和实践总是有一定的差异,课堂教学的启发与实验室、工作室或工业中的实际应用本身就存在差异。这样的情况对于人工智能来说更多见。根据我的经验,这个问题常常被归结为是“学习人工智能”还是“制造机器人”。Russell、Norvig、Rich、Knight这些人工智能中的杰出范本实际上对构建机器人并没有多大帮助,你必须挖掘在线教程、YouTube视频等去学习如何建造机器人。机器学习也是如此,一篇文章可以为学生介绍神经网络,比如,Bishop可能是你了解这门学科的最好途径,但是要想构建一个神经网络,学生必须找到合适的C或Python库。理论和应用之间的桥梁(如图1所示)不仅距离遥远,而且要求人们具备不同的能力。需要补充的一点是,人工智能本身不足以制造机器人,由于机器人的特性,它还需要利用电子、机械设计、传感器设计和其他交叉学科的知识来实现。本书尝试缩短这个桥梁,并希望通过将概念与实际应用相互联系,让读者更容易跨越它。
图1 从人工智能到应用人工智能的桥梁。(对于初学者来说,这两个领域代表了两个不同的学科。本科生会发现很难看出人工智能学说的收敛性。例如,规划、搜索和知识表达是制造机器人的哲学基础和分析工具,但在初学者阶段,它简化为简单的编程脚本、传感器与电机的接口,这样更便于设计。因此,人工智能和机器人之间的相关性对年轻的爱好者来说可能不是很明显)
这些应用包括第2章和第3章中的设计简单的行为,第4章中的导航,以及多机器人系统和群集,其中许多补充了来自实际场景的示例、算法和软件介绍。导航的独特性在于它是一种基本行为,也是一种设计工具。第5章有几个关于硬件的例子,用来激发机器人爱好者的想象力和创造力。
2.协商与反应及关联性问题
这两种有关基于智能体的机器人技术的实现途径的争论是由Rodney Brooks在20世纪80年代中期进行开创性工作时引发的。然而,这种思想可以追溯到行为主义和现象学。行为主义是斯金纳通过19世纪90年代末巴甫洛夫、Thorndike的工作在20世纪50年代确立的一个心理学分支学科。Husserl、海德格尔和Merleau-Ponty在现象学领域的哲学发展帮助巩固了情境性概念与主体性概念。Walter、Toda和Braitenberg这三位大胆的科学家分别在20世纪40年代末、20世纪60年代中期和20世纪80年代初希望创造出人造生物,所以分别独立地将这些想法吸收到了机器人技术中。Walter在他的海龟模型中明确展示了行为设计,Toda提出了自主主体的第一个模型,而Braitenberg的理想实验表明,简单的主体可以带来非常先进的性能。这些独立的结论形成了基于行为的机器人的基本原理。
框架问题和关联性问题是机器人设计中固有的麻烦,这也构成了争论的核心。这个问题不能被根除,只能在基于行为的范式中完全避免,或者在PENGI这类软件中考虑把它处理到最小化。与此形成对比的是,我们人类可以“在运行中”“解决”框架问题。目前,大多数机器人都具有协商式和反应式模块,并辅以机器学习能力,因此至少克服了在一个几乎已知的环境里含有的低级重复行为的关联性问题。然而,这个令人讨厌的麻烦一次又一次地出现。功利主义与道义论关于自动驾驶车辆的争执正是协商式与反应式争论的直接扩展,所有道义论使用的方法都被视为与预先设定规则的“框架”相关联,而功利主义原则基于即时性。此外,就像第9章中讨论的那样,大多数开发自主意识机器人的尝试,实际上是对关联性问题的探究:铃鼓的动态与它的拍子有关吗?看镜子时机器人会发现自己的影像吗?机器人能懂得适当的因果关系,并将动作与结论联系起来吗?毋庸置疑,我希望相信只有当机器人能像人类一样用五种感官解决框架问题时,它才是有意识的。
Fodor声称由于框架问题,人工智能已经消亡了。过去二十年的研究让我们看到,有关框架问题的争论已经丰富了人工智能的内涵。
3.工程机器人行为
我认为了解行为最好的参考书就是Ronald Arkin的巨著Beha-viour Based Robotics,Richard Vaughan和Alan Winfield的著作和这本书中的相当一部分内容都记录了机器人预期行为工程学。
反应式系统比协商式或混合式系统运行得更快、更容易设计,它们不需要像照相机或激光扫描仪那样井然有序的硬件。通过对比可以看出,由于行为是自然发生的,所以很难设计有预期表现的架构。像“追踪光源”或“跟随线条”这样非常简单的行为,很难显示出智能体与环境之间的内在联系。群体机器人和Braitenberg的小车模型有助于说明这样紧密的关系以及设计的易化性与性能的不可预测性之间的对比。Gerardo Beni非常巧妙地总结了这一现象,认为机器人的行为融合了不可预测性和寻求秩序这两种完全不同的想法。在过去的三十年里,机器人行为的定义已经被修改,在未来几年可能会进一步被修改。
Walter的海龟理论是基于智能体的机器人的开端,但Simon和后来的Toda通过它设想了一个具有路标和多目标的自我维持的移动主体,它可以在补给和工作之间进行权衡。食菌者在遥远的行星上开采铀并收集真菌,而真菌消化则为它们提供了能量,Toda的模型也是早期的路径规划模型。火星探测器可以说是现代食菌者的化身,尽管它们是利用太阳能电池板而不是火星真菌来获得能量。
20世纪80年代,Wilson的ANIMAT模型、Pfeifer的基于智能体的机器人设计和开发原则,还有Lumelsky和Stepanov的Bug算法,都基于来自大自然的灵感,简化了自动自我维持移动主体的设计原则。
Braitenberg的小车模型包含了更多相关功能的设计,如情感、价值系统、信息对应、整理现实以供记忆、学习和进化,所有这些都来自简单的运动感知原理。Braitenberg的小车模型在许多章节中都作为阐述的示例出现,也是本书中反复出现的主题。
人工智能的灵感来源于自然界,从行为学研究得出的设计和行为模型中的拟人灵感可以看到这种趋势。最好的例子是:Fukuda的肱动脉运动灵感来自猿猴的摆动运动;ECOBOT系列机器人是在消化过程之上建模的;群体行为设计来自昆虫和鸟类的交哺现象;INSBOT项目将机器人诱饵引入蟑螂群体中等。
机器人组和群体机器人之间的对比可帮助我们进一步理解如何设计一种行为的方方面面。反应式方法是多群体机器人的基础,机器人之间的这种内聚性是一个优点,因为它能灵活地适应局部环境的动态变化,而且在不妨碍性能的情况下更容易扩大规模。然而,群体机器人臭名昭著,因为很难保证其可靠性以及将其性能标记为容错因子。因此,设计一个预期的群体行为比一种前沿技术更能成为未来研究的课题。而设计具有协商范式的机器人组在本地Wi-Fi网络上工作更为安全且可以预测,但是它们不太灵活、缺乏通用性且难以扩大规模。
4.类人智能复制
几乎所有的人类活动动机都可以被归类为生存或好奇。前者对我们的自我平衡至关重要,后者则促进了文化、社会、智力、技术等的进步。无论是在低级行为还是在复杂行为中,机器人设计都开发了这两个方面。阿西莫夫定律记录了自我保护,同时也编码进了简单机器人里,如扫地机器人。而好奇心则与现象的出现紧密关联,也是基于行为范式的驱动力。
基于行为的方法不足以满足伦理责任和人为意识的要求,伦理问题在发展途径中找到了最佳答案,而有关机器人的人为意识问题已经开始在各种途径中进行探索,机器人还没有类人的意识行为。要充分解决伦理和意识问题,就要对人脑进行研究,机器人仍需等待在医学、神经学和心理学领域有所突破。
5.开源机器人
机器人套件Player/Stage/Gazebo和后来的ROS是为Ubuntu安装而设计的,有助于将真实机器人的运行和仿真领域统一起来。这些软件套件功能以客户端-服务器的方式运行,并鼓励代码块中的众包、按硬件设计和调整,从而建立机器人硬件和软件的基准。ROS还整合了Arduino、Raspberry Pi、ODROID等开源硬件,使设计和开发新的机器人更加模块化,从而向众包开放。
6.有自主意识的机器人——不仅仅是工具、机器或奴隶
作为一个机器人爱好者,如果一本相关的图书没有提到艾萨克·阿西莫夫,那么它将不能得到我的认可。他对人类机器人社会的愿景是本书第8章的背景。然而,他的三条定律却被发现是相互矛盾的。它们存在实现问题并缺乏实际应用。同样,图灵测试更多只是一个概念,而不是一个真正能用来区分自然和人工的工具。阿西莫夫定律和图灵测试的这些失败让我们开始反思机器人到底是什么,它们是否会达到人类的标准以及它们可能会拥有怎样的未来。人工智能的最大胜利将是机器人能够获得自由意志并表现出类人的感知行为,而不是把机器人归类为工具或奴隶,这些想法将在第9章中进行讨论。
在实验室中研制拥有道德伦理的机器人已经取得了成功,它们也许很快就能作为护士和护理机器人得到应用。然而,对于机器人意识的关注仍然要么比较狭窄,要么时间比较短。
这场机器人革命胜利的不幸后果是人类会失去工作机会,这在报纸、博客、在线论坛和竞选宣言等广泛领域引发了激烈争论。如果这种趋势继续下去,我们可能很快就会有一个现代的卢德革命,它可能改变我们的社会规则和经济体系,并要求对自动化和人工智能的使用加以限制。对于人工智能最伟大成就的讽刺并没有就此结束,机器人毁灭人类,或者占领我们的世界,以及把人类降为二等物种,这种灾难性的未来现在看起来貌似会成真。领域专家预言这会是我们进化轨迹中的新达尔文式“跳跃”,这些将在第10章中讨论。
人工意识会为我们带来可能对人类造成毁灭性影响的超级智慧生物,最终导致人类灭绝吗?这种质疑让我想起了小时候父母告诉我的一个印度神话故事。这个故事是关于四个学习过生理学、解剖学和医学的门徒的,他们开始磨炼处理现实世界中问题的技能。这四个人发现了一具老虎尸体,为了检验他们的技能,第一个门徒把死老虎的骨头拼成了直立状态,第二个门徒按骨骼的结构提供肌肉,这还没有结束,第三个门徒添加了器官,第四个被认为是最聪明的人,他对自己的技能毫不掩饰,不顾其他三人的警告,赋予了老虎生命。故事的结局是个悲剧,老虎咆哮着跳了起来,吞食了四个门徒。我们把自己比喻成这四个有胆量的门徒,如果我们不够小心,人工智能很快就会反扑到我们身上。
7.作为科学新定义的人工智能
科学是对宇宙运行的基本原理的研究,很大程度上基于实验和观察。这种一贯统一的知识体系是由我们的感官感知,并由我们大脑的处理能力推断出来的。当我们走向以自动化、自我丰富的人工智能智能体和虚拟现实为主导的未来时,技术(特别是人工智能)将决定实验和观察的过程。因此,人工智能将成为引导我们走向科学的工具和准则。此外,人们相信,当接近技术奇点时,技术增长将打破历史纪录,对于我们自己掌握的生物智能来说,速度太快了。随着人工领域处理能力的增强和信息的过剩,我们对科学是从逻辑中提取的信息和原理的统一体的定义,以及因果关系,将开始与人工智能紧密联系在一起。
我们能够预见,拥有惊人处理能力和获取令人难以置信的信息量的超级智能机器人正站在浪漫和恐怖的十字路口,并已经有了一些存在。Skynet、AGI/ASI、Good的超智能自复制机器,当然还有技术奇点的名字,都将在最后一章中详细讨论。库兹韦尔认为,到21世纪40年代,人类在虚拟领域的活动将超过在现实世界的活动,并且会伴随着能消除死亡的大脑上传(至少就我们所知是这样),这将引导我们走向生物与人工之间的无缝衔接。因此,人工智能将是一门涵盖所有已知知识和信息领域的学科,无论是象征性的还是感性的,都指向范式的转变,从而产生新的科学定义。
本书的写作使我发现了自己就是兼职艺术家和菜鸟漫画家,大量的漫画和示意图都是我自己草拟的。我在各种各样的网络漫画中找到了幽默和智慧,包括非常流行的xkcd、Far Side、Dilbert、Oatmeal、smbc、Zen Pencils,以及没有那么出名的Widder的Geek and Poke、McDermott的Red pen Black pen以及Iyad Rahwan个人网页上的漫画。
人工智能科学家和机器人学家在他们的研究论文中所表现出的内在幽默感帮助我创作了这些漫画,通过这些漫画也能看出一个人的习惯和观点。例如,阿西莫夫的胡须、Brook的大象、Kirsh的耳蜗、PENGI的企鹅模型、丹尼特的R2D2变体框架问题的图解、手推车问题、霍金关于暂停人工智能的观点、智力竞赛、Sparrow的测试、哲学僵尸、内格尔的Bat等,这些都能在我的漫画里找到踪迹。另一个令人振奋的理由是,如图2所示,本书是为人类读者编写的,可能并不会吸引那些在未来岁月里敢于阅读这本书的机器人和其他超智能实体。用幽默感,特别是漫画来帮助阐述概念,可以通过讽刺的方法把概念融入人类的记忆中,这样基本不需要像更传统的教授概念的方法那样死记硬背。
图2 McDermott的神秘山。(幽默感强调的是人类社交互动[223],并反对在人工领域重新创造它的尝试。这可以看作与Masahiro Mori的神秘谷[214]相同。幽默感是人类的独有特性,智商在125~140的普通人最容易拥有它。它随着智商的增加而减少,对于一个可以接触世界各地各种信息的机器人来说,幽默感几乎可以忽略不计)
需要提及展示史蒂芬·霍金和咆哮中的Roomba机器人的漫画,机器人上面有一张写着1和0的海报。这幅画展示在原书内封上,它讲述了我们正在考虑暂停人工智能的故事。
除了我的漫画,还有著名动画家和艾美奖获得者也为此做出了杰出的贡献,在第3章中有Maciek Albrecht 3张草图的复制品,第2章中有Mark Shrivers的一幅厚脸皮的漫画。还有4组一对一的访谈:(1)希腊亚里士多德大学的STDR团队;(2)韩国首尔Yujin Robot的Daniel和Marcus;(3)新西兰奥克兰大学的Elizabeth Broadbent;(4)日本明治大学的Junichi Takeno。Cool Farms团队、Antony Beavers(Genesis at TwinEarth)、Alan Winfield(The Walterians)、Owen Barder的博客(Trolley Prob-lems)以及Kevin Kelly的博客(Maes-Garreau Law)也善意地为我们提供了很多趣味横生的参考文献。对于软件,斯沃斯莫尔学院的Matt Zucker允许我使用他的基于网络的Braitenberg小车模拟器,我的好朋友兼合作者Luke Dunn让我使用他的Wall-E/Eva Python对话脚本。
本书中使用以下两种工具来向读者传达思想和信息。
1.Toby和Walkers
Toby是一台个人机器人,也是这本书的吉祥物,出现在四个短的连环漫画中。我的早期机器人草图如图3所示。这是2015版本的Toby,其设计灵感源于对企鹅的拟人化,只不过没有嘴。它有着差动驱动、交互式触摸屏、迷你键盘、摄像机和一组声呐定位仪。它的售价为600美元。我们没有对2036版本进行详细讨论,为读者的想象力和未来的发展都留下了空间。在第1章的第一幅连环漫画中,Walkers被一个关于彗星探索机器人Philae的消息逗乐了。在第二幅连环漫画中,Walkers购买了一个C3-90机器人作为圣诞家庭礼物,机器人通过感知到的和明显的亲和力与小孩建立联系,而相比之下,父亲和年长的孩子却把它作为一个技术珍品。在第三幅连环漫画中,Toby在处理母亲的急诊方面发挥了作用。在最后一幅连环漫画中,在2036年,机器人过时了,人们给了它新的设计和新时代的硬件,以及人形外骨骼和仿人类习惯进行沟通的能力。这给了Toby一个新的化身,使得它更像一个人类而不是一个单纯的机器。Toby的故事流传了21年,这反映了人类对机器人可能会产生的爱宠关系,也阐述了现代和未来机器人的各个方面,并暗示了前面讨论的七个主题。
图3 Toby——第一张草图。(这是我2015年夏画的最早的连环画草图。四部连环画描绘了基于智能体的机器人的各种显著特征,并对人机交互的未来进行了推测。在教材中出现连环画似乎是不合适的,但轻松幽默的气氛有助于产生各种主题,如半感知范式、人工智能体的伦理、人机交互的当前问题、开源机器人、近乎人类习性和社会价值观的机器人的未来等。这四部Toby连环漫画由我设计、开发、勾画草图,使用CC-by-SA 4.0许可)
2.排版约定
为了阐述清楚一些重要的信息,我使用了4种类型的方框,以下是对这些贯穿全书的方框类型的解释。
1)方括号:在提到某个定义或规则时会使用。其中包含了非常重要的信息,而且与内容紧密相关。
2)方框:展示某些可能比较有趣但无法在书里详细展开的信息。目的是增加吸引力,但与内容不是特别相关。
3)上下边框:用于案例和展示。
4)灰色阴影:包含非常有趣的信息,很多都是通过我的个人渠道获得的一些信息,包括采访和个人邮件中的信息。
在机器人的帮助下,我们在宇宙征程中最远可到达彗星67P。医学界前沿研究以最先进的机器人达·芬奇和宙斯系统为傲。护士机器人和Paro分别是在护理行业和治疗领域的最新尖端应用。在军事上,DARPA为美军机器人应用提供了各种先进的选择,这也加剧了伦理争论。自动驾驶车辆和运载机器人,如Starship等,是运输行业的最新创新。很明显,机器人正在融入我们的生活,而个人机器人产业可能是未来十年中最有前景的产业之一。
总之,应该对机器人的未来持乐观态度。它们集人类努力和设计、美学、逻辑以及社会互动的心智能力为一体,而且是技术与自然达成协调的最好例子,接下来的内容将会佐证这些想法。
[1] 这是Vikramaditya国王和一个叫Betal的幽灵进行对话的25个故事之一。
[2] 他的3张草图的标题是由我完成的。