深度学习技术图像处理入门
上QQ阅读APP看书,第一时间看更新

2.1 人工智能、机器学习与深度学习

近年来,深度学习的概念十分火热,人工智能也由于这一技术的兴起吸引了越来越多的关注。我们将结合一些基本的用例,简要介绍一下这个新的技术。

首先需要明确人工智能、机器学习以及深度学习三者之间的关系,如图2-1所示。如NVIDIA官网文章所述,人工智能是一个非常大的概念,而机器学习只是人工智能的一种实现方法。深度学习同样也是一种实现机器学习的方法,是在机器学习的基础上建立起来的。首先,从字面上看,二者都是在“学习”,因此在评价深度学习训练出的模型好坏时,同样直接来源于机器学习的评价方法。其次,深度学习最基本的形式是深度神经网络,直接脱胎于机器学习中的神经网络模型。

图2-1 人工智能、机器学习以及深度学习三者之间的关系

(图片来源:https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/)

正是由于深度学习直接脱胎于机器学习理论,因此本书将首先介绍一些基本的机器学习知识。机器学习本身包含了很多内容,如果对其进行简单的分类梳理,可以归于以下几类:

  • 非监督学习
    •  聚类
    •  降维
    •  ...
  • 监督学习
    •  回归问题
    •  分类问题

单纯讲概念,可能看起来有些枯燥,我们不妨把机器学习和人类的学习行为类比一下。监督学习相比非监督学习最大的区别是,这种方法有明确的评价指标,这种指标类似学校里的考试成绩,我们可以简单地认为考试成绩高,这个学生就是好学生。对于机器而言,就是机器训练的模型在给定的数据集中,预测准确率高,这个模型就是一个好模型。因此我们不妨认为监督学习就是一种唯分数论的应试教育方法,参见表2-1。

表2-1 监督模型

有应试教育,就有素质教育。素质教育并非没有评价标准,但是相比应试教育要宽松很多,在考察过程中,手里可以有更多的主观因素。这一点在非监督学习中同样成立。如一句古话所言,“近朱者赤,近墨者黑”,要评价一个人如何,就看他平时和什么样的人在一起。非监督学习中的各种聚类方法,同样使用了这种思想,就是并不直接评价某一个体,而是看个体之间的接近程度,将众多个体归为少数几个群体,再基于这个群体的特征进行简要概括。

试卷中有主观题和客观题,我们用来类比的监督学习同样可以分为这两种。我们知道主观题的答案,如语文阅读、政治历史问答题,是不要求跟标准答案完全一致的,其评价标准也是越接近越好;这一点就类似机器学习的回归问题,比如用模型预测房价、股市走势,大致预测出价格趋势就非常了不起了,不可能圆、角、分全部正确才认为预测正确,差一分就预测错误。而简单的客观题,如判断题、单项选择题,只有固定数目选项,必须和标准答案完全一致才算正确的,这一点类似于机器学习的分类问题,比如预测一个人是否患有某种疾病,有就是有,没有就是没有。

注意,这里有一个误区,即认为素质教育优于应试教育。现在机器学习领域中的吴恩达等学者也一再强调非监督算法的重要意义,实际上拿到一个学习任务后,具体使用哪一种方式去分析还是需要考虑应用场景的。通常我们不了解这个学习任务的目的性、需要找线索时,会用非监督找线索,包括聚类、降维方法等。如果明确了学习的目的性,追求高准确率,就需要使用监督学习的方法了。

由于本书是入门读物,并且希望给读者带来快速上手的体验,因此我们将在接下来的过程中主要介绍监督学习的分类部分。