段永朝 人工智能思想渊源初论
段永朝,信息社会50人论坛执行主席、北京苇草智酷科技文化公司创始合伙人、北京大学新闻与传播学院兼职专硕导师、杭州师范大学阿里巴巴商学院特聘教授。
2016年,谷歌公司的智能围棋程序阿尔法狗(AlphaGO)打败韩国顶尖棋手李世石,这给国际社会做了一次人工智能的科普,社会上掀起了一股人工智能旋风。随即,接二连三的顶尖高手败给阿尔法狗,再次让人工智能成为现实世界中的热议话题。它所引发的震撼,同1997年俄罗斯国际象棋大师卡斯帕罗夫(Garry Kasparov)与IBM的电脑“深蓝”(Deep Blue)交锋的人机大战引发的震撼相当。
从技术发展史的角度看,这一次人工智能的复兴,可以看作1956年出现“人工智能”(AI)这个术语之后,历经推理演算与机器定理证明、专家系统与知识工程之后的第三次高潮。对于这一高潮,技术界公认可以从2006年加拿大多伦多大学教授杰弗里·辛顿(Geoffrey Hinton)发表关于深度学习的开创性论文《深度置信网的快速学习方法》(A Fast Learning Algorithm for Deep Belief nets)算起。
然而,从技术思想的演变脉络看,人工智能的第三次复兴与前两次高潮相比有什么不同呢?西方的人工智能思想的源泉到底是什么呢?在大家思考与讨论人工智能的深层问题的同时,还有哪些更加基本的问题值得一并探讨呢?这些问题对于理解人工智能的根本问题及未来趋势,具有十分重要的意义。
一、超越两分法
现在,人工智能成了一个老少皆宜的话题。这一现象正说明计算机与互联网所带来的数字世界,业已深度“植入”日常生活。大家关注人工智能,并非仅仅是好奇、赞叹和仰慕,更多的是感受到了人工智能日盛一日、咄咄逼人的气势。过去一段时间以来,笔者所参加过的所有涉及人工智能的研讨会或论坛,最后都会聚焦到一个问题,即对于人工智能,是持悲观态度还是乐观态度,这似乎是讨论人工智能的一个天花板效应。其原因如下。
第一,今天的人工智能给人们带来了一种侵入感。十年前,美国杜克大学神经生理学教授尼克莱利斯(Miguel Nicolelis)就实现了通过在大脑植入电极捕捉脑神经元信号,开发所谓的“脑机接口”,实现“意念传递”和意念控制。美国华盛顿大学的实验披露,两个完全处于不同实验室、彼此隔离的实验者,可以通过“电子头套”实现“脑波互传”。据英国《独立报》披露,瑞典有超过4000人通过将芯片植入皮下成为“电子赛博格”。还有报道称,制药公司已开发出包含“智能技术”的智能药丸,可以从人体内向外发送体内生化反应的相关数据。
今天的人工智能已经远不是此前人们通过大众媒介和日常生活了解到的机械、电子、自动装置,今天的机器人具有深度“嵌入”“植入”人体的种种可能。这一点在引发人们无限遐想的同时,也触动了人们敏感的神经。人们所忧虑的是飞速变化的技术背后那只“看不见的手”的力量,是无孔不入的隐私窥探、“数据裸奔”和精神压迫,以及无处可逃的被奴役、被剥夺的感觉。
第二,十年前流行的“量化自我运动”,通过发明可穿戴计算装置、谷歌眼镜等,从技术上实现了人体运动和生理数据的24小时实时采集。加之自1993年互联网面向社会公众开放之后,沉积在互联网上难以计数的人类活动所遗留下来的网络足迹、浏览记录、交易记录、位置信息、账单信息,以及丰富的音视频信息等,通过大数据算法和人工智能算法、仿真与模拟技术,使得人们构建对应实体世界的数字化身成为新的可能。
人们在互联网上的点点滴滴,已经数字化为包裹地球的“数字大气层”,成为人们的幻影、化身,乃至生命网络的一部分。人们所担心的是当这些纠缠、融入、裹挟人们自身的数据碎片,再次通过算法推演、大数据挖掘成为反哺人类的生存物料的时候,人类是否知情、能否知情,以及是否有选择、取舍、拒绝、遗忘等的权力。
基于以上两点来看,所有参与讨论人工智能的研究者,如果最终止步于只能在悲观和乐观中选择一个立场的话,实际上已经在这一次人工智能崛起的浪潮中,不幸沦为“后手”,已经丧失了在事情未发生之前就参与到议程设置中的可能性。他们只是看客,只是受众,只是消费者,只是被实验者。他们只能选择自己的立场和风险偏好,将对人工智能的总体看法归结为乐观主义或悲观主义,然后就身不由己地被迫卷入这场别无选择的“游戏”之中。
因此,今天讨论人工智能的思想来源,就必须增加一个新的维度:不能只梳理和看待人工智能研究者的心路历程,也必须将出现的这种研究冲动纳入更大的历史文化视野之中。任何研究者都不是孤立的存在,研究者的研究成果也不仅仅属于研究者本人。这个世界没有旁观者,所有的人都是参与者。只是在信息时代之前,参与者并不知晓自己的参与方式罢了。换言之,按照今天人工智能的发展特征和整体样貌,区分研究者、使用者和生产者、消费者的二元结构是徒劳的。
两分法的二元结构,并不能让人们更方便地做出对技术伦理的某种公正评判。技术伦理问题不再是“后置”或“前置”的选项,而是“并置”的问题。对于硅谷那些夜以继日的工程师们来说,当他们沉醉在代码世界的时候,他们当然认为这并无不妥。他们认为这样可行,是因为西方自古希腊以来的“逻各斯”(Logos)传统。经历长达2000年的演变,古希腊先哲们确立的柏拉图理念论和亚里士多德实在论,在文艺复兴之后结出了体系化的硕果。以至于德国数学家莱布尼茨(Gottfried Wilhelm Leibniz)就气定神闲地讲过:以后的哲学家都不需要争吵了,如果有冲突,那么就拿起纸和笔,“来,让我们计算吧”。英国哲学家霍布斯(Thomas Hobbes)认为,推理就是计算。在这样的思想传统下,一百年前的英国哲学家、数学家罗素(Bertrand Arthur William Russell)和德国数学家希尔伯特(David Hilbert)纷纷提出雄心勃勃的计划,即要把数学王国的知识谱系建立在扎扎实实的逻辑演算,或者形式化体系的基础上。
了解这段历史的人都知道,希尔伯特和罗素的思想纲领所引发的第三次数学危机,在1932年奥地利数学家哥德尔(Kurt Gödel)之后无疾而终。人们只是知道,这样包罗万象、雄心勃勃的计划不可能实现。其实,这也是自1956年出现人工智能之后,前两次人工智能高潮之所以衰落的思想根源所在。
二、超越还原论
互联网、人工智能带来的认知重启,最终会在哲学层面表现出来。如果不深究人工智能背后的“图谋”,很容易在人工智能的狂潮中迷失方向。
人工智能贯穿的思想渊源是什么?要知道,人工智能、机器人并非东方文化的传统,人工智能是西方的传统、西方的语境。美国女作家麦科达克(Pamela McCorduck)曾在1979年出版的一本书的前言中写道,“这是遍布于西方知识分子的观点,是一个急需被实现的梦想”。这是一种荣格(Carl Gustav Jung)意义上的“原型思想”。
古希腊的“皮格马利翁效应”(Pygmalion Effect)说的就是这个意思。皮格马利翁是塞浦路斯的国王,不近女色。但他又是一个雕刻家,他雕刻一个女人,然后爱上了这个女人,这感动了上帝,上帝就给这个雕像以灵魂,最后让雕像和国王结成夫妻。这种情结,展现了赋予无生命的东西以生命的思想。
文艺复兴以后,理性精神高扬,很多思想家探究万物背后的“至理”,比如,斯宾诺莎(Baruch de Spinoza)的伦理学,就是仿照欧几里得的《几何原本》写的。这些思想家内心深处有一个原型,就是认定存在少数几个不言而喻的公理,整个世界可以通过“逻各斯”方法演绎出来。只要找到这样一种思想体系,就能从根本上把握整个世界的运转。法国数学家拉普拉斯(Pierre-Simon Marquis de Laplace)就曾说过这样的话,给我初始条件,我将(通过微分方程)推演出整个世界。
麦卡锡(John McCarthy)、纽厄尔(Allen Newell)、西蒙(Herbert Alexander Simon)是人工智能的先驱,这一行列还包括控制论的创始人维纳(Norbert Wiener)、信息论的创始人香农(Claude Elwood Shannon)、神经生理学家皮茨(Walter Pitts)和麦卡洛克(Warren McCulloch)。1956年肇始的人工智能就建构在这样的信念之上:可以将人的智能、人的思维还原成符号演算过程,还原成机器语言,并通过机械、电子元器件制造出可以与人的大脑相媲美的智能机器。事实证明,这一信念在人工智能半个多世纪的发展中,日渐显露出在哲学意义上的困顿。
人工智能背后所蕴含的“图谋”或者说雄心,其实就是今天“言必称希腊”所指的世界本源。雅斯贝尔斯(Karl Theodor Jasper)所说的“轴心时代”,是指人类几大文明在2500年前一个狭小的时间窗口期内,奔涌出丰富多彩的文化溪流,转而汇聚成基督教文明、伊斯兰文明、儒家文明、佛教文明的文明长河。
这个文明长河的一个特征就是追溯、探寻所谓的“终极意义”。终极叙事的传统绵延流长,工业文明的终极叙事只不过是“大写的人”“理性的人”“进步主义”,等等。人类今天的文明冲动,依然不能摆脱追本溯源的理念,不能摆脱“一揽子建构宏大体系”的欲望。还原论、本质主义、总体性、两分法等,总是让人们相信有至高无上的神在那里,这个神在自然科学里面就是牛顿或爱因斯坦所信奉的那个神。人们相信,最后总可以把“那个东西”手拿把攥地掌握在手中。“那个东西”是什么呢?是本源、本质、真理等,不一而足。
也正因如此,自1956年创立人工智能以来的种种努力,都在致力于打造能够替代人的“通用问题求解系统”,都希望能把机器智能建立在对人的智能的模仿上。换言之,对人的假设依然是法国学者拉美特里(J.O. de Lamettrie)在1747年出版的《人是机器》一书中的观点,即“人是一架机器,在整个宇宙里只存在一个实体,只是它的形式有各种变化”。
三、重新理解“人”
2016年是人工智能这一学科诞生的60周年。60年间,人工智能有过三次高潮,又两度低落。前两次的人工智能高潮,无论是电脑下棋,还是专家系统、神经网络计算,都基于“造出与人脑相媲美的机器”的假设展开进一步的研究和探索,但最终都无疾而终。第三次人工智能高潮有何不同?通过阿尔法狗可以知道,这一次与此前的最大不同就在于,这一次的人工智能技术基于深度学习和知识网络,而此前的人工智能技术基于机械的还原论。
但是这一次人工智能会不会受挫?按照强人工智能和弱人工智能的分类法来说,强人工智能指人工智能可以像人一样思考,像人一样行动;弱人工智能指模仿人的智能展开理性思考、推理,以及理性行动的系统。弱人工智能也许有可能成功,其只不过是把机器人当成工具,认为人最终还是需要掌控世界的。
第三次人工智能的复兴依然面临挑战,原因在于:迄今为止,人工智能的理论基础丝毫没有发生变化,依然是“心智计算理论”(Computational Theory of Mind,CTM)。基于心智计算理论的分析模型依然是基于还原论、符号表征和数值计算的。当然,这并不是说这一次的人工智能不会有什么令人称奇的成果,而是说它终究走不远,终究需要在数学理论上有重大的突破。
简单地说,人们今天使用的数学是基于分析数学的,是基于牛顿、莱布尼兹的数学分析传统的。基于0、1计算的数学,在表达更多的内容(如包容悖论)方面,依然是力不从心的。笔者斗胆地认为,自1931年哥德尔(Kurt Friedrich Gödel)发表“不完备定理”(Incompleteness Theorem)以后,数学没有任何重大进展,数学思想已经固化。一百多年来,数学界依然在希尔伯特划定的23个伟大的问题的圈子里修修补补。今天的人工智能技术依然建构在分析数学、数理逻辑的基础上,它是一个逻辑演算体系。
西方数学的思想渊源在于:数学有两大分支,第一大分支是几何学,第二大分支是代数学,古希腊早期的数学是几何学传统。但是,很多人不知道毕达哥拉斯传统其实与几何学的关系更近一些。几何学是关于测量的,代数学是关于计算的,代数学是阿拉伯传统,源于贸易。但东方的数学,如《周易》中数、象、意所表达的空间不是单一维度的,数为形而下的表征工具,象为隐喻,意则为内嵌的启示。这三个词属于不同的层级。但在东方文化中,将不同层级的信息联系起来,观察它们彼此依存、此消彼长的生发变化,是一种完全不同于西方数学传统的数学知识。只不过,用西方数学的符号体系,尚不能表达这种意蕴。退一步而言,勉强使用西方数学符号表达的东方思想,总会降低其意指空间,会导致思想的降维。
事实上,西方的系统科学业已发现,复杂系统的层级理论是目前最为复杂的理论。目前学科专门化后,对于从上层解构到下层解构的拆解,西方的学术界做得很好,但对于从下层解构向上层解构的“生发”“涌现”,依然缺乏强有力的表达路径。
虽然东方话语体系中的“金木水火土相生相克”,尚不能与西方话语体系中的“还原”“符号”“计算”进行良好转换,但至少问题是提出来了,数学思想期待东西方文化共同深入对话。数学在东方语境下已经变成隐喻,也就是“积极的能指”。但如何跨越符号的鸿沟,获得与“所指”之间的联系和解释,是东西方文明需要共同面对的一个大问题。
近几年,西方数学界也在反思这一问题,希尔伯特的代数优先传统是否会被几何传统重新超越,这是遗留给21世纪的数学家的一个重大问题。笔者认为,数学家阿贝尔(Niels Henrik Abel)和伽罗华(Évariste Galois)的群论,以及后来的范畴论,应当是非常有前景的领域。因为群论、范畴论突破了数学的“计算功能”,聚焦于“数学概念的生成”。今天的数学没有办法表达中国传统文化中的“相生相克”是个重大缺憾。如今,人工智能的心智计算理论依然基于柏拉图、亚里士多德、牛顿的思想体系,其只是想把认知转化成计算,这是一个重大问题。
上海大学数学系史定华教授曾谈到,真正的大数据是有生命的,是“活”的。史定华教授研究“血谱”十余年,他认为,充满在血液中的基因,是典型的、流动的大数据。关于大数据的话题,近五年来,笔者与史教授有过多次的交流,我们一致认为,大数据是有生命的,是生命本身,不是基于测量的。基于测量的大数据是死的,真正的大数据是活的,是有生命的。
这么说的理由有以下三点。第一,数据采集蕴含着“对象化”“客体化”的方法论。任何一次具体的数据采集所获得的结果,都只是对所谓对象的一次有限的“摹写”。真实、自在的“对象”自在生长,变动不居,永远“隐藏”在“面纱”之后。法国哲学家阿多(Pierre Hadot)教授在《伊西斯的面纱》一书中引用古希腊赫拉克利特(Heraclitus)的箴言“自然爱隐藏”,对此有详尽的分析,不复赘述。
第二,在西方自然观念的演化史中,通过“征服”接近自然,“掀开伊西斯的面纱”具有观念上的正当性和合法性。对于这一点,阿多教授称之为“普罗米修斯的胜利”。也就是说,古希腊传统的自然观全然接受这种通过“切割”“计数”“研磨”“提纯”“度量”等方法找到通往普世真理的道路。这些方法在文艺复兴、启蒙运动之后渐渐成为近现代科学方法中的本质主义、还原论、可分离原则的思想内核。这一致力于还原论信仰的内核,天然是抗拒“整体”的。
第三,近一个多世纪以来,在对生物学、生命科学的深入研究中,不乏传统还原论方法所结出的硕果,这表明了从整体上认知生命、认知世界的重要性。这一系列研究包括:生命是演化的(达尔文);生物体具有社会属性(生物社会学创始人威尔逊);生物基因与文化基因(meme)之间有双向塑形作用(道金斯、威尔逊);人类大脑与爬行动物、哺乳动物,特别是灵长类哺乳动物之间共享相似的脑结构(麦克利恩);灵长类哺乳动物大脑中存在能产生共情作用的“镜像神经元”(拉玛钱德朗)。这些研究成果越来越多地与东方古代的“天人合一”的智慧相汇合,越来越多地指向一种对生命的“新”的认知:生命与外在环境具有不可分割的整体性。这里之所以把“新”字加一个引号,是想特别强调这种“万物互联”的生存状态其实并不是全新的,更不是技术专家、商人所许诺的所谓“美好未来”,而是被技术革命“中断了的”生命的本真状态。在四海为家、四处迁徙、天崩地裂的状况下,“万物互联”才是生命的本真态。这种你中有我、我中有你、相互依存、共生演化的状态,本来就是万物互联的“活”的世界。
从马林诺夫斯基(Bronislaw Kaspar Malinowski)、列维−施特劳斯(Claude Levi-Strauss)所做的人类学田野研究看,他们发现在太平洋南部的岛国、在非洲或拉美的一些地区,一种蘑菇会有三四百种名称。如今都有名词类别,比如芭蕉、香蕉、蘑菇、西瓜,人们都用一个抽象名词概括一个类别。但是对于原始部落来说,没有抽象名词,称谓是非常具象的。早上八点的蘑菇是一种发音方法、一种名称,中午12点的蘑菇又是另一种名称;幼年期的蘑菇是一种名称,长成后的蘑菇又是另一种名称。所以可以猜想,那时候人与自然是万物互联的,人与自然之间是心心相印、息息相关、生生不息的关系。所以,游牧时代的心智结构,或者说游牧之前(采摘狩猎时代)的心智结构,本来就是万物互联的。
从以上三点来看,今天的数据科学家、智能科学家在很大程度上依然迷恋传统的还原论、两分法。在此,笔者想强调的并不是还原论、两分法的对与错,而是要有所超越。认知科学不应该只基于测量及基于心智计算理论的假设。
要深刻地理解什么是人的智能,首先要理解什么是人。哲学上的概念是主体、本体。互联网、人工智能研究者要学习海德格尔(Martin Heidegger)的哲学,学习现象学和符号学;同时,也要超越现象学和符号学。因为人不只是孤立的存在,也是“在世存在”,更是“天人合一”。人与外界的关联须臾不可分。人已不再是可以抽离出其肉身的抽象的本体。具身性智能(Embodiment Intelligent)是一个非常好的研究视角。
四、具身性:人工智能的身体转向
身体转向是非常重大的哲学的转向,要特别关注这个转向的意义和价值。对身体的唤醒,是从尼采开始的。尼采诘问:为什么要发明一种沉思冥想的生活?沉思冥想其实就是灵魂出窍,如果“灵”都不在了,那人在思什么,在焦虑什么?一个灵魂出窍的躯体,当他具备强大的思考能力的时候,他思考的是什么?尼采提出的这些问题是后世结构主义、存在主义、后现代学者思考的一个核心问题。尼采重新发现了身体,重新发现身体意味着必须对“存在”重新思考。
“身体”在这里不是一个简单的生活术语,也不是医学名词,而是哲学术语。还有什么比身体更具体、更鲜活的思考对象吗?它充满欲望,有温度,有激情,每天都充满着生长和死亡的双重旋律。梅洛−庞蒂(Maurice Merleau-Ponty)所称的“肉身”,就是这个针扎一下会流血、会抽搐的肉体所构成的、有灵性的躯体。身体不只是物质性的,也是精神性的。物质的“肉身”和精神的“灵魂”在身体中共生。这里爆发着的、流淌着的每个词语、行为,都不是单一物质、精神两分法可以言说和解读的。传统的知识对身体是回避和忽视的。福柯(Michel Foucault)对身体的解读值得深思,需要认真分析对身体的“治理术”是如何演变的。现代性是如何关注人的?从执迷生死予夺到安排生活秩序,从控制无名个体到管理、分化人,从否定性压制身体到肯定性劝导身体,现代人很容易假设身体是白板,是信号接收系统,始终在等待被超出其控制的社会力量重构。这样的“身体观”,也就是德勒兹(Gilles Louis Rene Deleuze)所说的“无器官的身体”。
梅洛−庞蒂指出,身体是社会建构中的多维中介,社会结构是“涌现”出来的,“探索身体与社会之间的关系,就是在处理具有重要因果意义的突生性现象”。在互联网环境下,身体的实在性变得越来越不确定。比如“赛伯格”(Cyborg)的概念,其将人与机器、人与虚拟空间的共生关系看作未来重新定义个体的基本假设。新的人机共同体将解构传统生物学、社会学意义上“人”的概念。人的边界被打开,他和她不再闭锁在具象的躯体之内,而是延展、遗撒在整个互联网上,不但作为原子存在,而且作为比特存在,作为超链接存在。不确定的身体并不意味着身体本身趋于消解,而是意味着传统的、基于肉身本体的人的主体将会重新构建。重新发现身体,以及身体在社会建构中的中介作用,是理解第三次人工智能发展的重要问题。
“具身性”(Embodiment)是过去20年来在西方学界越来越受关注的一个词语。机器人技术、人工智能、虚拟现实技术正在掀起一股强大的科技旋风,但这次的人工智能与60年前大有不同,根本的区别就在于其对智能的假设发生了本质的变化。
当年的人工智能是一个雄心勃勃的计划,即未来十年人类能造出一个超越人的智能的机器,这一人工智能热潮很快就沉寂了。关于这一过程,可以参见《人工科学:复杂性面面观》一书。人工智能在20世纪50年代兴起又很快衰落,根本的原因在于人们的“梦想”错了,当时的人们试图确定性地构建人类智能的基本原理,并在此基础上运用电子技术、工程技术将这种智能复现出来。
产生这种战略误判的根源是什么?在传统的知识框架下,人对自然、对人类自身、对这个世界的基本假设存在固有的认知结构。这个认知结构的关键点就是“还原论”。发端于法国思想家笛卡尔(René Descartes)的还原论认为,存在一个客观如实的物理世界,人可以最终透彻地了解这个世界的运行规律和内在构造,并运用人类智慧将这种内在的规律和构造表达、呈现出来。
在这种情况下,人的身体和人的智能是剥离的关系,人们只要掌握类似牛顿定律一样的方程式,就可以把智能完整地表达出来,这是一个致命的缺陷。认知科学的主张与此不同,具身性智能致力于“交互”这个核心概念,认为智能产生于、涌现于行为体与外部环境的交互,通过持续不断的交互,行为体对外部世界的认知逐步建立起来,进而与外部环境共同演化。
由此可见,具身性强调的是交互、感知和当下性、流动性。迄今为止,西方的科学语言尚不能令人信服地表征这一哲学。但在笔者看来,哲学的第三次转向,即身体转向,已经切切实实地浮现出来。
过去有离身性智能,而现在又有具身性智能,也就是说人类给机器赋予什么代码和指令不重要,人类能不能控制机器不重要,重要的是这个机器能不能跟外界交换信息,这个机器能不能感知环境的变化。所以,从具身性角度看,今天的人工智能是非常智能的,例如,无人驾驶机器人可以编队飞行,可以穿越障碍,可以进行非常灵巧的飞行。如果按照过去人工智能的那种操控一切、编码一切的思路,这种智能是完全实现不了的。所以,这次人工智能的革命是根本性的革命。
理解人工智能,需要把注意力集中到智能思维的转变这一点上来。传统的对智能的理解是静态的、割裂的,是立足于还原论、两分法的。今天的第三次人工智能的哲学思想已经悄然地发生了改变,已经把交互、连接作为问题的焦点。这一变化的意义何在?简单而言就是过去的人工智能强调对个体的认知,今天的人工智能强调对关系和交互的认知,这符合互联网的内在特性。
多样化、迭代和共生演进是互联网的三个特性。无数个碎片化的个体相互连接、相互嵌套,处于一个无时无刻不在发生变化的互联网之中。个体之间随时随地发生的相互作用,不但交换着能量和物质,也交换着信息。在这种多样化的世界中,存在生命的迭代和演进,这种迭代和演进是共生的。这是新一代人工智能的启示。