从机器学习到深度学习:基于scikit-learn与TensorFlow的高效开发实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.5 本章内容回顾

◎ 机器学习的三个要素:明确的任务、可衡量、可训练。

◎ 虽然出发点不同,但机器学习与数据挖掘共用了大部分方法与流程。

◎ 机器学习是人工智能四大领域中的一个。另外三个领域是:自然语言处理、知识表示、自动推理。

◎ 机器学习技术的发展正影响着人工智能的另外几个领域。

◎ 目前的人工智能尚无所谓的人类自我意识。

◎ 机器学习开发的一般流程:定义问题→收集数据→多次迭代比较算法模型→选取最优模型并应用。

◎ 机器学习算法的三大类:有监督学习、无监督学习、强化学习。另有一些综合工具:如隐马尔可夫模型、贝叶斯网络、文档主题模型。

◎ 有监督学习可分为两大类:分类与回归。

◎ 无监督学习主要包括聚类、降维等。

◎ 强化学习的目标是训练一个在环境中可成长的智能代理,是最接近人工智能原本目的的一个学习方法。

◎ 学习中常用的三个数据集:训练集、验证集、测试集。

◎ 交叉验证概念与方法。

◎ 几个评估指标:准确度、精确度、召回率、调和均值、平均绝对差、平均方差。前四个用于离散值标签问题,后两个用于连续值标签问题。

◎ 拟合不足是模型无法匹配训练数据的问题。过度拟合是模型过于匹配训练数据、同时导致无法匹配测试数据的问题。