人工智能与人机博弈(物联网在中国)
上QQ阅读APP看书,第一时间看更新

1.2.4 智能技术的初生:人工智能的期望膨胀期

20世纪30—50年代,信息论首次深入研究了信息,控制论研究了人与动物共同的控制与通信规律,计算机理论直接为人工智能提供了理论基础。接下来,脑模型、神经计算与模糊数学理论则打开了生物脑及其智能的大门。越来越多的人开始关注“智能”这一概念,人的智慧是如何解决实际问题的?神经系统如何运作以应对复杂的环境?机器能否同人一样具有高超的智力?

1.达特茅斯会议

1956年夏季,美国达特茅斯大学举办了一次重要的研讨会,参与人员只有10人,除数学家克劳德·香农外,其他几位在当时都还是名不见经传的年轻人,然而后来他们都成了人工智能历史上伟大的先驱学者。达特茅斯会议标志着“人工智能”这门新兴学科的正式诞生,会议中提出了三大猜想,即明斯基的SNARC学习机,麦卡锡的α-β搜索法,以及西蒙和纽厄尔的“逻辑理论家”,这奠定了有关人工智能的理论基础。

明斯基提出进行数据建模,实现在计算机内自主识别和判断的网络模型,并称为神经网络理论。明斯基在会议上展示了神经网络计算机SNARC的雏形,并且指出人类大脑复杂的思维机制,可以通过技术手段引入到计算机的逻辑运算中,从而使得计算机具有自我学习的能力。这一理论在几十年后得到了验证,并制造出了许多高性能的机械生命体。

麦卡锡的α-β搜索法可以说是针对计算机下棋程序诞生的,它的目的是如何减少计算机需要考虑的棋步,使得搜索能够更高效地进行。对于α-β搜索法,我们可以通过“扑克牌比大小”的例子来理解。在一场比赛中,A和B分别代表牌局对决双方,他们之间的博弈关系就是谁的扑克牌面大。按照规定,A将手中两套不同的扑克放在两个不同的盒子里,假设第一个盒子里装着“桃心10”和“梅花Q”,第二个盒子里装着“桃心8”和“梅花J”。由B来抽取其中一个,假设B抽取了第一个盒子中的“桃心10”,再抽取第二个盒子,而这一次抽取,是需要和第一次抽取的结果进行比较的。如果在第二个盒子中抽到的最小的牌面都大于“桃心10”,则B一定会放弃第一个盒子的方案;如果在第二个盒子抽到最大的都小于“桃心10”,则第二个盒子的方案将不在B考虑范围内。至此在本次搜索中,搜索结果低于或超过既定值,本次搜索停止。α-β搜索法至今仍是解决人工智能技术问题中常用的高效方法。

西蒙和纽厄尔提出的“逻辑理论家”程序能够进行非数值思考,实现自动定理证明,已成功证明了伯特兰·罗素(Bertrand Russell)主编的《数学原理》一书第2章52个定理中的38个定理。该系统被认为是计算机探索人类智能活动的第一个真正的成果。

2.感知器:初级的脑模型

1958年,美国著名的心理学家罗森布拉特(Frank Rosenblatt)在《心理学评论》上发表了著名论文《感知器:脑的组织与信息存贮的概率模型》,该论文推广了MP模型,提出了著名的感知器模型(脑感知模型)。罗森布拉特感知器是用于线性可分模式分类的、最简单的神经网络模型,一个神经元构成的感知器可以完成两类模式的线性划分,在此基础上很容易推广到多个神经元的感知器,多神经元感知器可以完成多种分类。这项理论打开了深入研究人工神经网络的大门,为20世纪80年代多层感知器的研究奠定了基础。

感知器[27]也称为感知机,是人工神经网络中的一种典型结构,它的主要特点是结构简单,是生物神经细胞的简单抽象,单个神经细胞可被视为一种只有两种状态的机器——激动时为“是”,而未激动时为“否”。这被视为一种最简单形式的前馈式人工神经网络,是一种二元线性分类器。

罗森布拉特给出了感知机的学习(训练)算法,主要有感知机学习、最小二乘法和梯度下降法。感知机算法可以找到神经元的各个连接权值应该是多少,从而实现类的自适应划分(见图1-29)。例如,感知机利用梯度下降法对损失函数进行极小化,求出可将训练数据进行线性划分的分离超平面,从而求得感知器模型。感知器的收敛原理就是通过训练感知器,自动把两类分开。

图1-29 神经元与感知机模型

感知器模型鼓舞了人工智能研究者,最初被认为具有良好的发展潜能,但感知器最终被证明不能处理诸多的模式识别问题,如不能解决简单的异或(XOR)等线性不可分问题。明斯基及西摩·佩伯特(Seymour Papert)等人在当时已经了解到多层神经网络能够解决线性不可分的问题。

3.神经网络

明斯基被称为人工智能之父,也是框架理论的创立者。1946年,他进入哈佛大学主修物理,并选修了电气工程、数学、遗传学等多个学科专业,在哈佛大学获得学士学位后,进入普林斯顿大学进修并获得数学博士学位。他的学术研究涉猎广泛,不仅是人工智能领域的权威,而且在认知心理学、数学、计算机语言、机器人和光学等多个领域都作出了重要贡献。

1951年在普林斯顿大学,明斯基和同学埃德蒙兹构建了第一台基于模拟突触增强原理的随机连线网络学习机器人,这是第一台神经网络机器人,也是世界上第一个神经网络模拟器,是人工智能最早的尝试之一,它能够在其40个“代理”(人工神经元)和一个奖励系统的帮助下穿越迷宫。在此项研究的基础上,明斯基综合利用他多学科的知识,解决了使机器能基于对过去行为的知识预测其当前行为的结果这一问题,并以《神经网络和脑模型问题》(Neural Nets and the Brain Model Problem)为题完成了他的博士论文,于1954年取得博士学位。他的博士论文《神经-模拟增强系统的理论及其在脑模型上的应用》具体地阐述了这台神经网络计算机的工作原理。

1969年,明斯基和佩伯特在《感知器》一书中,经过严格的数学分析,证明了罗森布拉特感知器的学习缺乏一般性,从本质上无法实现全局的优化。单层感知器解决线性问题的能力差,例如,它的输入输出之间不能形成“异或”逻辑函数关系,对非线性问题更是无能为力。

由于罗森布拉特等人没能够及时推广感知机学习算法到多层神经网络上,加上明斯基在该研究领域中的巨大影响,导致人们对感知器和一般神经网络的计算能力产生了严重怀疑,造成了人工神经网络领域发展的长时期停滞及低潮。1969年,科学家发明了“误差反传学习算法”,但是直到20世纪80年代,反向传播算法才被人们广泛接受。多层感知器、径向基函数网络、支持向量机等神经网络有了自己的学习算法,也都克服了单层感知器的计算局限性。

1987年,明斯基承认他们的认识局限性,《感知器》书中的错误得到了校正,并更名再版为Perceptrons-Expanded Edition。20世纪90年代初期,科学家采用严格的数学方法,证明了多层感知器可以表达任何函数关系,具有强大的计算功能。

4.扎德模糊数学

当智能学沿着神经计算方向发展时,数学家扎德提出了向人思维特征靠拢的模糊集理论:模糊数学。模糊数学又称Fuzzy数学,是研究和处理模糊性现象的一种数学理论和方法。

在人类的生产实践、科学实验、日常生活及语言表达中,人们经常会遇到模糊概念(或现象)。例如,大与小、轻与重、高与矮、快与慢、长与短、动与静、深与浅、美与丑等都包含着一定的模糊概念。例如,我们常常谈论一个人的身高,说某人足有1.8m高,1.8m是一个比较精确的概念,还可以更精确些;而高个头、矮个头、中等身高等概念是模糊的、不确定的。在日常生活中,我们无须苛求所有事物的准确性,因为有些精确的判断并无意义。

模糊数学研究的意义在于:不同事物之间、同一事物的不同发展阶段常有渐变的过渡性特征,导致事物区分上的模糊性;人类思维反映客观事物的规律也具有模糊性,所以概念、判断、推理常常具有模糊性;从世界的复杂多变和人类认识的随机应变性来说,过于准确、精细、严格的推理和计算可能会导致认识的局限性,模糊性、不确定性也意味着多种可能性。模糊数学正好提供了模糊关系、模糊模式识别、模糊逻辑与推理等一系列的数学方法,这种理论更接近客观事物和人类智能的实际,成为当代智能学的支柱之一。

图1-30 扎德

扎德[28](Zadeh)(见图1-30)是一名优秀的数学家和控制论学者,先后在美国麻省理工学院和哥伦比亚大学获得硕士、博士学位。他的早期研究主要集中在系统论和决策分析上。

1965年,他在美国杂志《信息与控制》上发表了数学史上第一篇模糊数学论文《模糊集合》,自此他的研究方向转入模糊集理论及其在智能系统、语言学、逻辑、决策分析、专家系统和神经网络领域的应用。

扎德开创性地提出了模糊集理论,这种数学更贴近人类的思维。模糊数学是一个较新的现代应用数学学科,它是继经典数学、统计数学之后发展起来的一个新的数学学科,它把数学的应用范围从确定性的领域扩大到了模糊领域,即从精确现象到模糊现象,模糊集理论是研究具有模糊性的量的变化规律的一种数学方法。

扎德指出,若对论域(研究的范围)U中的任一元素x,都有一个数Ax)∈[0,1]与之对应,则称AU上的模糊集,Ax)称为xA的隶属度。当xU中变动时,Ax)就是一个函数,称为A的隶属函数。隶属度Ax)越接近于1,表示x属于A的程度越高,Ax)越接近于0表示x属于A的程度越低。用取值于区间[0,1]的隶属函数Ax)表征x属于A的程度高低,这样描述模糊性问题比起经典集合论更为合理。

模糊集理论[29]引入了取值在[0,1]整个区间的“隶属度”概念。隶属度属于模糊综合评价函数里的概念:模糊综合评价是对受多种因素影响的事物做出全面评价的一种十分有效的多因素决策方法,其特点是评价结果不是绝对地肯定或否定,而是以一个模糊集合来表示。例如,如果认为1.8m肯定算高个,隶属度等于1;可能1.7m不能肯定算是高个头,但在一定程度上属于高个,可以认为它属于高个的隶属度等于0.45;属于中等身材的隶属度为0.6。

模糊逻辑摒弃了二值逻辑简单的否定和肯定,是二值逻辑的扩展,使计算机模拟人类思维、处理模糊信息成为可能。1974年,英国工程师曼德尼将模糊集合和模糊语言用于锅炉和蒸汽机的控制,创立了基于模糊语言描述控制规则的模糊控制器,取得了良好的控制效果。1979年,他又成功地研制出了具有较高智能的自组织模糊控制器。模糊控制的形成和发展,对智能控制理论的形成起到了十分重要的推动作用。因此模糊数学大大地扩展了科学技术领域,在众多领域得到了应用。例如,20世纪80年代以来,模糊控制的家电产品大量上市,在机器人与过程控制、故障与医疗诊断、交通灯控制、声音与图像处理、市场预测等领域模糊控制也得到了广泛应用。