1.1 人工智能概述_机器学习与深度学习-QQ阅读中文科幻网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

1.1 人工智能概述

人类的生产和生活中，无时无刻不伴随着智能，如下棋、猜谜、写作、编程、驾车、说话、做饭等，都需要人用大脑去完成。如果机器能完成这些任务，那么就可以认为机器具备了“人工智能”。

1.1.1 人工智能产生的基础条件

人工智能与基因工程、纳米科学并肩，被称为“21世纪三大尖端技术”[1]。作为炙手可热的技术之一，它的产生并非偶然，而是由强大的基础条件作为背后的支撑的。为了搞清楚人工智能产生的原因，首先要熟悉它的相关概念，即信息、认知与智能。

我们知道，宇宙是由万物组成的，对世间万物的表示与表达，就是信息。为了实现人与人之间的交流，人们创造了语言文字来作为载体传递信息。

那么，认知是什么呢？认知是大脑对外部世界的反馈过程，即信息经过感官（视觉、听觉等）输入神经系统，大脑对其进行加工整理，形成对外部世界的判断，并确定万物之间的联系。

在认知的基础上，人类运用脑思维，可以在各种信息之间挑选、加工、改造、解释，从而形成智能。简而言之，智能即智力，就是对各种信息进行处理的能力，包括学习能力、抽象思维能力、环境适应能力、创造能力、稳定情绪的能力等。

众所周知，计算机诞生于20世纪40年代。通过几十年来软件和硬件技术的不断发展，它的物理体积越来越小，计算速度与存储容量却呈现爆炸式的增长。最初的计算机应用是为了解决数值计算问题，如今随着硬件条件的日益成熟，人们很自然地提出用计算机去模拟人类的智力活动，如进行图形图像检测、语言翻译、声音识别等。此时的计算机已不再是纯粹的数值计算器，而是能够取代人类进行部分活动的机器智能机。

总结起来，人工智能的产生有赖于两大基础条件，即理论基础和技术基础。理论基础包括信息论、控制科学、数学、计算机科学、认知科学等的相互交叉融合；技术基础则是电子技术与计算机技术广泛应用的结果。

1.1.2 人工智能的发展史

1.人工智能的思想萌芽（20世纪30年代）

早在20世纪30年代，计算机还没有诞生，一些学者就已经开始思考计算的本质，并探索形式推理与计算之间的联系。被称为“人工智能之父”的图灵，当时不仅创造了一个简单的非数字计算模型，而且证明了计算机可以用智能的方式进行工作，由此出现了人工智能的思想萌芽。

2.人工智能作为学科而出现（20世纪50年代）

1956年夏，美国达特茅斯学院举办了一个长达两个月的研讨会，由当时美国年轻的数学家John-McCarthy和他的众多学者朋友参加，其中包括明斯基（Minsky）、纽维尔（Newell）、西蒙（Simon）、香农（Shannon）、塞缪尔（Samuel）等。他们来自数学、心理学、神经学、信息论、计算机科学等学科。在会上，McCarthy提出了“Artificial Intelligence”一词，之后纽维尔和西蒙提出了物理符号系统假设，从而创建了人工智能学科。

3.人工智能的第一次低谷（20世纪70年代）

20世纪70年代，人工智能的发展跌入了低谷。当时，许多科研人员低估了人工智能问题的复杂性，导致在实践过程中遇到了三大瓶颈问题：①计算机性能不足，许多早期的程序只能解决维度较小的简单问题，一旦维度上升，计算机的硬件能力就无法满足；②人工智能的问题模型规模较小，所设计的程序解决不了大规模的运算问题；③人工智能的实现本身需要大规模的数据来支撑，当时无法找到容量足够大的数据库作为底层的载体来支撑。

4.人工智能的崛起（1980年）

1980年，一个名为“XCON”的专家系统被卡内基梅隆大学设计出来，并由数字设备公司投入使用。它采用“知识库+推理机”的结构，本身是一套专业知识和经验都很完备的计算机智能系统，并为该公司带来了商业价值。随后，其他的专家系统也相继诞生了，且价格不菲。此时，像Symbolics、Lisp Machines这样的计算机软件公司也随之成立了。

5.人工智能的第二次低谷（1987年）

1987年，苹果公司和IBM公司生产的台式计算机在性能上超越了Symbolics等公司生产的通用计算机。此时，专家系统就变得黯然失色，人工智能系统从此走向衰败。

6.人工智能再次崛起（20世纪90年代至今）

1997年，IBM的计算机“深蓝”完胜国际象棋世界冠军，引起了全世界公众的广泛关注，这是人工智能技术发展的一个重要里程碑。2006年，Hinton在Science期刊上发表了一篇文章，介绍了关于深度神经网络（也称深度学习）在人工智能领域取得的重大突破性成果。至此，人工智能在全球范围内日渐火热。

1.1.3 人工智能的几个重要分支

通过1.1.1节和1.1.2节，读者能够明白，人工智能就是让计算机去实现人类智能。换言之，人工智能即机器智能。人工智能之所以能如此火热，归根结底在于，具有智能的机器可以帮助人们解决生产生活中的各种问题，为社会创造效益，服务于人。人工智能可以分为如下几大分支，且它们相互交叉，相互渗透。

1.规划与调度

规划与调度（Planning & Scheduling）是智能系统的一种，它通过计算和优化，帮助人们确定最优的调度或者组合方案。这类系统广泛应用于城市规划、军事指挥、导航等。比如：

（1）全球定位系统（Global Positioning System，GPS）。根据城市路况，在出发点和目的地之间规划出一条最优路线（如红绿灯少、距离短、公交换乘少等）。

（2）空中交通控制系统。在繁忙的大型机场，每天有数以千计架飞机起升和降落，依靠人工安排起降和导航非常困难。空中交通控制系统能有条不紊地安排调度，最大限度保证安全，减小延时。

2.专家系统

专家系统（Expert System）是一个有大量专门知识和经验的程序系统，其核心思想是“知识+推理”。它应用人工智能技术，在多个领域模拟人类专家的决策过程，以解决复杂的问题。比如：

（1）1968年，被誉为“专家系统和知识工程之父”的Feigenbum所领导的研究小组成功研制了第一个专家系统——DENDRAL，用于分析有机化合物的分子结构。

（2）匹兹堡（Pittsburgh）大学开发了一个名为Internist的医疗诊断系统，其中的数据库包含15万条医疗知识，几乎可以诊断所有的常见疾病。

3.模式识别

模式识别（Pattern Recognition）是人工智能最重要的研究领域之一。所谓“模式”，是指一切可观察可感知的事物的存在形式，如声音、图像、文字等。“识别”是人类所具备的智能，因为在日常生活中人们要对所见所闻的事物进行判别。模式识别的研究目标如下：让计算机通过各种感官装置去获取外界信号（图像、声音等），然后将信号输入计算机内部进行加工处理、分析、推断等过程，最终实现识别。例如，通过摄像头拍摄汽车牌照，进行车牌识别；通过监控探头拍摄人脸图像，进行身份识别。模式识别的其他应用还包括语音识别、指纹识别、遥感图像识别等。

4.机器学习

机器学习（Machine Learning）作为人工智能的一个分支，旨在运用数值法、信息论、神经科学、统计学等方法，为人工智能的实现提供一系列训练和判别的方法。“训练”指的是根据已知的数据样本，通过一系列人为给定的方法，让计算机获取数据的特征信息，也称为特征提取或模型训练；“判别”则是根据所提取的特征，去判别未知的样本信息。例如，性别的判断，对人而言很简单，对计算机来说却不那么容易。首先，计算机需要获取性别已知的样本（假设10男10女），通过训练，计算机可以提取能够区别性别的特征（如肌肉密度、说话声音频率、三围比例等），同时过滤掉与性别无关的特征（如肤色、年龄、血型等）。在测试过程中，运用提取的特征，计算机就能判断出眼前这个性别未知的人是男还是女。

5.数据挖掘

近年来，随着计算机硬件技术及互联网技术的飞速发展，数据的获取能力和存储能力得到爆炸式的增长，产生了超大规模和分布式的数据库及数据仓库。同时，电子商务、企事业单位数据、工业生产等各方面规模的日益扩大，也提供了海量的数据来源。在此背景下，一个新兴的人工智能分支——数据挖掘（Data Mining）诞生了。从大规模的数据中挖掘出有价值的潜在信息，意义十分重大。数据挖掘不仅前沿，而且涉及人工智能的多个分支，如机器学习、模式识别等。例如，国外曾经有人从大量的商业数据中通过机器学习的手段，挖掘出了啤酒和婴儿尿布之间的销量关系。从表面上看，这两者风马牛不相及，但商家通过数据挖掘找到了商机。

6.机器人

机器人（Robot）是一种可再编程的多功能操作装置，大致分为智能机器人和非智能机器人两类。

非智能机器人需要事先设计好控制程序，然后由人工去手动控制它的运行，一般用于工业生产。非智能机器人可以把工人从繁重、重复的生产工作中解放出来。但是它本身不具备智能，不能感知周围的环境，只能依靠人去实时操作。

智能机器人可以在一定程度上感知环境，并会记忆、推理、判断，从而模仿人的行为。这类机器人可以帮助人们到危险的环境中工作，避免人受到伤害。例如，在高温、高压、含有害气体等条件恶劣的地方，智能机器人可以自主工作，并向人们反馈结果，如进行海底探测、太空探索、战区排雷、高空作业、井下勘探等。

1.1.4 人工智能与机器学习和深度学习的关系

读者可能会问，本书作为“人工智能人才培养丛书”的分册，且书名叫《机器学习与深度学习》，那么人工智能、机器学习与深度学习到底是什么关系呢？图1-1给出了这三者的逻辑关系。

图1-1 人工智能、机器学习和深度学习之间的关系

从图1-1中可以看出，机器学习是人工智能的一个分支，而深度学习又是机器学习的方法之一。1.2节和1.3节中将分别介绍机器学习和深度学习。