第一部分机器学习的基础知识

第1章机器学习概览

不久前，如果你拿起手机问它回家的路，它会不理你，人们会质疑你的理智。但机器学习不再是科幻小说：每天都有数十亿人在使用它。事实上，它已经在一些专业应用程序中存在了几十年，例如光学字符识别（Optical Character Recognition，OCR）。第一个真正成为主流、改善数亿人生活的ML应用程序在20世纪90年代风靡全球：垃圾邮件过滤器。它不完全是一个具有自我意识的机器人，但它在技术上确实称得上是机器学习：它实际上学得非常好，以至于你很少需要再将电子邮件标记为垃圾邮件。紧随其后的是数百个ML应用程序，它们现在悄悄地为你经常使用的数百种产品和功能提供支持：语音提示、自动翻译、图像搜索、产品推荐等。

机器学习从哪里开始，又在哪里结束呢？机器进行学习到底意味着什么？如果我下载了所有维基百科文章的副本，我的计算机就真的学会了什么吗？它突然变聪明了吗？在本章中，我将首先阐明什么是机器学习，以及你为什么想要使用它。

在我们开始探索机器学习大陆之前，我们先看一看地图并了解这片大陆上的主要区域和最显著的地标：监督学习与无监督学习及其变体、在线学习与批量学习、基于实例与基于模型的学习。然后，我们将了解典型机器学习项目的工作流程，讨论你可能面临的主要挑战，并介绍如何评估和微调机器学习系统。

本章将介绍每个数据科学家都应该牢记的许多基本概念（和专业术语）。虽然本章是概述（这是唯一没有太多代码的一章），相对简单，但我的目标是确保在我们继续阅读本书的其余部分之前，一切对你来说都是非常清楚的。所以喝杯咖啡，开始学习吧！

如果你已经熟悉机器学习基础知识，你可以直接跳到第2章。如果你不确定，可以尝试回答本章末尾列出的所有问题，然后再继续。

本周热推：

面向中国制造2025的智造观

第一部分 机器学习的基础知识

第1章 机器学习概览

第一部分机器学习的基础知识

第1章机器学习概览