人工智能大冒险:青少年的AI启蒙书
上QQ阅读APP看书,第一时间看更新

1.5 人工智能、机器学习与深度学习

此时,智博士对人工智能还是似懂非懂,但是爱较真的他脑子里仿佛充斥着各种概念,他想梳理清这些概念,于是他拿起手机,开始在搜索引擎中查询信息,来解答自己对于各个概念的疑问以及它们之间的关系。

人工智能的浪潮正在席卷全球,很多专业词汇常萦绕在我们耳边,比如人工智能、机器学习(Machine Learning)、深度学习(Deep Learning)。人工智能中有一种叫作机器学习的技术,其中包含很多种算法,能够帮我们解决分类、聚类及回归等问题,而深度学习是其中的一类。除此之外,我们还有决策树、逻辑回归等算法,它们可以帮我们解决相应的问题。

图1-10是几个概念之间的关系,人工智能除了机器学习之外,还有专家系统等技术;机器学习除了深度学习之外,还有KNN、决策树等算法;深度学习包含卷积神经网络(CNN)等技术。

图1-10 人工智能、机器学习和深度学习

在近几年人工智能的浪潮下,应用最为广泛的还要属机器学习和深度学习等相关技术。后面的章节我们主要用机器学习和深度学习等方法,对人工智能做一些介绍。

我们不禁会想,到底什么是机器学习呢?机器学习不仅需要计算机程序去实现和支撑整个流程,还要依靠数据提供有用的知识,挖掘其中有用的信息,来完成从算法学习到模型,再用模型进行分类等任务的过程。

我们举一个例子来说明机器学习的过程。

大部分日常交互的计算机程序可以通过最基本的命令来运行,例如我们可以通过计算机程序计算1+1=?,或者开发一个网站,让用户输入个人信息,注册后可以浏览新闻等。然而,对于机器学习科学家来说,大部分应用没有那么容易。想象下如何写一个程序来对一张图片进行归类?如果你在一个只有代码编辑器的房间里,你将如何完成一个程序?你可能会想象下面的程序(以文字作为伪代码实现)。

●如果(图像包含小狗)

返回:图像是小狗,

●否则:

返回:图像不是小狗

但实际上,你只能得到图像里每个像素点的数值,这就是图像在计算机内的表现形式。那么什么样的规则才能把数据转换成我们要判定的类别呢?

如果你认为靠程序写一些规则很难解决这些问题,不用担心,这个时候我们可以运用人工智能机器学习来解决这些问题。

我们不是直接写一个狗分类器,而是创建一个程序,能在巨大的有标注的数据集里辨别狗,我们可以把这种方式看作是利用数据编程,这里一般包括以下几个过程。

●提取特征:获取已经有标注的数据,并从数据中提取有用的信息。

●训练模型:让计算机在数据中自动找规律,训练可以完成任务的模型。

●使用模型预测:使用上阶段训练好的模型,完成预测任务。

我们需要用数据训练机器学习模型,这个过程就像人在高考前练习历年真题和模拟题,从那些带有答案的例题中摸索相应的规律,而人工智能将这些规律总结成模型。这些模型往往用一些函数来表示,这个过程叫作训练,也就是根据提供的数据,找到一组函数中最合适的未知参数的取值,让建立在这些数据上的模型能够预测出最准确的结果。

下面来介绍一下机器学习的大致过程。

1.初始化一个几乎什么也不能做的人工智能分类器模型;

2.获取一些有标注的数据集(我们知道每个图像所属的类别,例如,某张图上是狗,某张图上是猫);

3.修改模型的结果,使它能在抓取的数据集上更准确地判断图像的类别(例如使它判断图像类别的结果越来越准确);

4.重复步骤2和3,直到模型预测得很准确。

预测模型训练好后,我们就可以使用狗分类器来判断小狗的所属类别了,这个阶段也叫训练阶段。这个阶段很像人类的高考阶段,经过训练阶段的学习,分类器已经足够完善,我们就可以进行考察,对考官发出来的图像进行判定。

我们可以用记忆中的图片来考验分类器,如图1-11所示。

图1-11 小狗分类器

在后续的章节中,我们将看到一系列分类、回归和聚类任务,以及如何通过机器学习、深度学习等人工智能算法解决这些问题。