
1.1 人工智能、机器学习与深度学习
本节简单介绍人工智能、机器学习与深度学习的关系。前几年各种媒体开始热炒人工智能,然后是机器学习,最近深度学习的热度很高。对于相关方面的从业者或对人工智能感兴趣的普通人来说,需要从这些铺天盖地的信息中找到对自己的职业或兴趣有益的信息。未来虽然充满风险,但理解清楚三者的关系,对后面的学习会有一个比较明确的整体认识,从而方便读者在未来人工智能越来越普及的体系中找到自己的定位。
1.1.1 人工智能的诞生
什么是人工智能?目前通用的定义是人工智能(Aritificial Intelligence,AI)是一门融合了计算机科学、统计学、脑神经学和社会科学的前沿综合性学科,如图1.1所示。

图1.1 人工智能涉及的各类学科
在人工智能的发展过程中,不断地将其他学科知识进行融合,才形成了今天人工智能的各种流派及各种流派的各种算法,使人工智能变成了一个横跨多个学科的前沿学科。人工智能发展简史如图1.2所示。

图1.2 人工智能发展简史
“人工智能”这个名词诞生于1956年的达特茅斯会议,下面以1956年为分割点,简要介绍一下人工智能的起源。
1956年达特茅斯会议的组织者是Marvin Minsky、John McCarthy及来自IBM的Nathan Rochester和Claude Shannon。会议提出的断言之一是:学习或者智能的任何特性的每一个方面都能被精确地加以描述,使机器可以对其进行模拟。与会者有Ray Solomonoff、Oliver Selfridge、Trenchard More、Arthur Samuel、Newell和Simon,他们中的每一位都在AI研究的第一个十年中做出了重要贡献,从而使1956年成为人工智能的元年。
1.1.2 人工智能、机器学习和深度学习的关系
人工智能(Artificial Intelligence)、机器学习(Machine Learning)和深度学习(Deep Learning)的关系如图1.3所示。

图1.3 人工智能、机器学习和深度学习的关系
由图1.3可以看出,这三者是包含与被包含的关系。简单来理解,机器学习是人工智能的一种实现方法,深度学习是机器学习的一种方法。现在很火热的深度学习属于连接主义,即仿生学派,更多的是对生物大脑的仿生,然后通过计算机的特性,对生物大脑的某一功能进行指数型的放大和加强。
1.1.3 深度学习的发展
2006年,Hinton提出了深度学习。机器学习的发展分为两部分:浅层学习(Shallow Learning)和深度学习。
浅层学习起源于20世纪20年代,人工神经网络的反向传播算法的发明,使得基于统计学的机器学习算法开始盛行,虽然这时候的人工神经网络算法也被称为多层感知机,但由于多层网络训练困难,通常都是只有一层隐含层的浅层模型。
神经网络研究领域的领军者Hinton在2006年提出了神经网络Deep Learning算法,提高了神经网络的能力,并向支持向量机发出挑战。2006年,机器学习领域的泰斗Hinton和他的学生Salakhutdinov在顶尖学术刊物Science上发表了一篇文章,掀起了深度学习在学术界和工业界的浪潮。这篇文章有两个主要的信息:
❑ 很多隐藏层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类。
❑ 深度神经网络在训练上的难度,可以通过“逐层初始化”(Layer-Wise Pre-Training)来有效克服。在这篇文章中,“逐层初始化”是通过无监督学习实现的。
深度学习的兴起,结合了天时、地利与人和。互联网及移动互联网的发展带来了一系列数据能力,使人工智能的能力得以提高,同时也急需一种技术来处理和利用已准备好的海量的数据,这是天时;运算能力从传统的以CPU为主导到以GPU为主导,异构计算等硬件设施的发展,这是地利;加上无数不同领域的科学家们不断地摸索和夯实理论基础,最终在2010年以后带动了现如今人工智能发展的高潮,这是人和。