
1.1 人工智能概述
人类的生产和生活中,无时无刻不伴随着智能,如下棋、猜谜、写作、编程、驾车、说话、做饭等,都需要人用大脑去完成。如果机器能完成这些任务,那么就可以认为机器具备了“人工智能”。
1.1.1 人工智能产生的基础条件
人工智能与基因工程、纳米科学并肩,被称为“21世纪三大尖端技术”[1]。作为炙手可热的技术之一,它的产生并非偶然,而是由强大的基础条件作为背后的支撑的。为了搞清楚人工智能产生的原因,首先要熟悉它的相关概念,即信息、认知与智能。
我们知道,宇宙是由万物组成的,对世间万物的表示与表达,就是信息。为了实现人与人之间的交流,人们创造了语言文字来作为载体传递信息。
那么,认知是什么呢?认知是大脑对外部世界的反馈过程,即信息经过感官(视觉、听觉等)输入神经系统,大脑对其进行加工整理,形成对外部世界的判断,并确定万物之间的联系。
在认知的基础上,人类运用脑思维,可以在各种信息之间挑选、加工、改造、解释,从而形成智能。简而言之,智能即智力,就是对各种信息进行处理的能力,包括学习能力、抽象思维能力、环境适应能力、创造能力、稳定情绪的能力等。
众所周知,计算机诞生于20世纪40年代。通过几十年来软件和硬件技术的不断发展,它的物理体积越来越小,计算速度与存储容量却呈现爆炸式的增长。最初的计算机应用是为了解决数值计算问题,如今随着硬件条件的日益成熟,人们很自然地提出用计算机去模拟人类的智力活动,如进行图形图像检测、语言翻译、声音识别等。此时的计算机已不再是纯粹的数值计算器,而是能够取代人类进行部分活动的机器智能机。
总结起来,人工智能的产生有赖于两大基础条件,即理论基础和技术基础。理论基础包括信息论、控制科学、数学、计算机科学、认知科学等的相互交叉融合;技术基础则是电子技术与计算机技术广泛应用的结果。
1.1.2 人工智能的发展史
1.人工智能的思想萌芽(20世纪30年代)
早在20世纪30年代,计算机还没有诞生,一些学者就已经开始思考计算的本质,并探索形式推理与计算之间的联系。被称为“人工智能之父”的图灵,当时不仅创造了一个简单的非数字计算模型,而且证明了计算机可以用智能的方式进行工作,由此出现了人工智能的思想萌芽。
2.人工智能作为学科而出现(20世纪50年代)
1956年夏,美国达特茅斯学院举办了一个长达两个月的研讨会,由当时美国年轻的数学家John-McCarthy和他的众多学者朋友参加,其中包括明斯基(Minsky)、纽维尔(Newell)、西蒙(Simon)、香农(Shannon)、塞缪尔(Samuel)等。他们来自数学、心理学、神经学、信息论、计算机科学等学科。在会上,McCarthy提出了“Artificial Intelligence”一词,之后纽维尔和西蒙提出了物理符号系统假设,从而创建了人工智能学科。
3.人工智能的第一次低谷(20世纪70年代)
20世纪70年代,人工智能的发展跌入了低谷。当时,许多科研人员低估了人工智能问题的复杂性,导致在实践过程中遇到了三大瓶颈问题:①计算机性能不足,许多早期的程序只能解决维度较小的简单问题,一旦维度上升,计算机的硬件能力就无法满足;②人工智能的问题模型规模较小,所设计的程序解决不了大规模的运算问题;③人工智能的实现本身需要大规模的数据来支撑,当时无法找到容量足够大的数据库作为底层的载体来支撑。
4.人工智能的崛起(1980年)
1980年,一个名为“XCON”的专家系统被卡内基梅隆大学设计出来,并由数字设备公司投入使用。它采用“知识库+推理机”的结构,本身是一套专业知识和经验都很完备的计算机智能系统,并为该公司带来了商业价值。随后,其他的专家系统也相继诞生了,且价格不菲。此时,像Symbolics、Lisp Machines这样的计算机软件公司也随之成立了。
5.人工智能的第二次低谷(1987年)
1987年,苹果公司和IBM公司生产的台式计算机在性能上超越了Symbolics等公司生产的通用计算机。此时,专家系统就变得黯然失色,人工智能系统从此走向衰败。
6.人工智能再次崛起(20世纪90年代至今)
1997年,IBM的计算机“深蓝”完胜国际象棋世界冠军,引起了全世界公众的广泛关注,这是人工智能技术发展的一个重要里程碑。2006年,Hinton在Science期刊上发表了一篇文章,介绍了关于深度神经网络(也称深度学习)在人工智能领域取得的重大突破性成果。至此,人工智能在全球范围内日渐火热。
1.1.3 人工智能的几个重要分支
通过1.1.1节和1.1.2节,读者能够明白,人工智能就是让计算机去实现人类智能。换言之,人工智能即机器智能。人工智能之所以能如此火热,归根结底在于,具有智能的机器可以帮助人们解决生产生活中的各种问题,为社会创造效益,服务于人。人工智能可以分为如下几大分支,且它们相互交叉,相互渗透。
1.规划与调度
规划与调度(Planning & Scheduling)是智能系统的一种,它通过计算和优化,帮助人们确定最优的调度或者组合方案。这类系统广泛应用于城市规划、军事指挥、导航等。比如:
(1)全球定位系统(Global Positioning System,GPS)。根据城市路况,在出发点和目的地之间规划出一条最优路线(如红绿灯少、距离短、公交换乘少等)。
(2)空中交通控制系统。在繁忙的大型机场,每天有数以千计架飞机起升和降落,依靠人工安排起降和导航非常困难。空中交通控制系统能有条不紊地安排调度,最大限度保证安全,减小延时。
2.专家系统
专家系统(Expert System)是一个有大量专门知识和经验的程序系统,其核心思想是“知识+推理”。它应用人工智能技术,在多个领域模拟人类专家的决策过程,以解决复杂的问题。比如:
(1)1968年,被誉为“专家系统和知识工程之父”的Feigenbum所领导的研究小组成功研制了第一个专家系统——DENDRAL,用于分析有机化合物的分子结构。
(2)匹兹堡(Pittsburgh)大学开发了一个名为Internist的医疗诊断系统,其中的数据库包含15万条医疗知识,几乎可以诊断所有的常见疾病。
3.模式识别
模式识别(Pattern Recognition)是人工智能最重要的研究领域之一。所谓“模式”,是指一切可观察可感知的事物的存在形式,如声音、图像、文字等。“识别”是人类所具备的智能,因为在日常生活中人们要对所见所闻的事物进行判别。模式识别的研究目标如下:让计算机通过各种感官装置去获取外界信号(图像、声音等),然后将信号输入计算机内部进行加工处理、分析、推断等过程,最终实现识别。例如,通过摄像头拍摄汽车牌照,进行车牌识别;通过监控探头拍摄人脸图像,进行身份识别。模式识别的其他应用还包括语音识别、指纹识别、遥感图像识别等。
4.机器学习
机器学习(Machine Learning)作为人工智能的一个分支,旨在运用数值法、信息论、神经科学、统计学等方法,为人工智能的实现提供一系列训练和判别的方法。“训练”指的是根据已知的数据样本,通过一系列人为给定的方法,让计算机获取数据的特征信息,也称为特征提取或模型训练;“判别”则是根据所提取的特征,去判别未知的样本信息。例如,性别的判断,对人而言很简单,对计算机来说却不那么容易。首先,计算机需要获取性别已知的样本(假设10男10女),通过训练,计算机可以提取能够区别性别的特征(如肌肉密度、说话声音频率、三围比例等),同时过滤掉与性别无关的特征(如肤色、年龄、血型等)。在测试过程中,运用提取的特征,计算机就能判断出眼前这个性别未知的人是男还是女。
5.数据挖掘
近年来,随着计算机硬件技术及互联网技术的飞速发展,数据的获取能力和存储能力得到爆炸式的增长,产生了超大规模和分布式的数据库及数据仓库。同时,电子商务、企事业单位数据、工业生产等各方面规模的日益扩大,也提供了海量的数据来源。在此背景下,一个新兴的人工智能分支——数据挖掘(Data Mining)诞生了。从大规模的数据中挖掘出有价值的潜在信息,意义十分重大。数据挖掘不仅前沿,而且涉及人工智能的多个分支,如机器学习、模式识别等。例如,国外曾经有人从大量的商业数据中通过机器学习的手段,挖掘出了啤酒和婴儿尿布之间的销量关系。从表面上看,这两者风马牛不相及,但商家通过数据挖掘找到了商机。
6.机器人
机器人(Robot)是一种可再编程的多功能操作装置,大致分为智能机器人和非智能机器人两类。
非智能机器人需要事先设计好控制程序,然后由人工去手动控制它的运行,一般用于工业生产。非智能机器人可以把工人从繁重、重复的生产工作中解放出来。但是它本身不具备智能,不能感知周围的环境,只能依靠人去实时操作。
智能机器人可以在一定程度上感知环境,并会记忆、推理、判断,从而模仿人的行为。这类机器人可以帮助人们到危险的环境中工作,避免人受到伤害。例如,在高温、高压、含有害气体等条件恶劣的地方,智能机器人可以自主工作,并向人们反馈结果,如进行海底探测、太空探索、战区排雷、高空作业、井下勘探等。
1.1.4 人工智能与机器学习和深度学习的关系
读者可能会问,本书作为“人工智能人才培养丛书”的分册,且书名叫《机器学习与深度学习》,那么人工智能、机器学习与深度学习到底是什么关系呢?图1-1给出了这三者的逻辑关系。

图1-1 人工智能、机器学习和深度学习之间的关系
从图1-1中可以看出,机器学习是人工智能的一个分支,而深度学习又是机器学习的方法之一。1.2节和1.3节中将分别介绍机器学习和深度学习。