前言

元学习（Meta-Learning）起源于General AI（普适人工智能），目标是让机器学会学习（Learning-to-Learn），让机器变得更加智能，代替人类完成更多复杂多变的任务。一般将元学习视为深度学习模型的补充，用于提高模型的泛化能力，将模型更好地泛化到差别较大的任务中。通常使用预训练模型结合调参的模式，在保持深度模型精度的同时，额外提高深度学习模型的泛化能力，减弱过拟合，提高深度学习模型在分布外任务的表现。泛化能力的提高可带来以下优势：（1）减弱模型的过拟合；（2）提高模型的样本外预测能力；（3）扩大模型适用的范围；（4）有利于在不同场景之间模型的融合，在同一场景下有更多的模型可供选择，既可以重新训练模型，又可以从相似任务的深度模型泛化而来；（5）提供模型之间交流的通道，有利于不同模型和机器学习框架的合作，基础学习器和元学习器可以是不同种类的机器学习模型。

元学习并不是一个新概念，早在1987年，科学家就提出了元学习，指的是机器与环境交互，不断获取信息，进行自我更新，适应不断变化的环境，在没有任何人为干预的场景下，机器能自发地适应环境并且进化，学会如何处理遇到的新任务。常见的元学习框架包括两个部分：（1）处理任务的基础层模型；（2）综合分析所有任务，并且指导基础层模型的元层，元层指导基础层模型更快更好地适应新任务。元层是综合所有问题解决经验的指挥层，代表知识层级中更加本质和普适的知识，能推广到新任务。基础层和元层表示任务包含的知识层级，基础层表示任务特性的知识，元层表示任务共性的知识。

本书介绍了元学习的发展历史和常用的元学习方法，以及这些方法的思路、改进、继承、应用。元学习的范畴并没有明确的界定，和迁移学习是相近的概念，即更新已有的模型完成新任务，避免重新训练模型。近期发展起来的许多元学习方法都借鉴了迁移学习的思路。本书来源于对早期元学习理论和近期元学习方法的整理，元学习的应用场景举例如下：（1）需要深度学习模型处理的高维数据（High-Dimensional Data）；（2）在线学习（Online Learning）需要及时更新深度模型；（3）优化问题，需要优化连续和离散的超参数，元层模型指导基础层模型优先探索更有潜力的超参数组合；（4）从头训练深度模型过于复杂以至于无法实现的场景，必须以过去的经验为基础来训练深度模型；（5）时间序列（Time Series）预测未来。

笔者接触元学习是在2018年，当时笔者使用频率较低（每半年）的公募基金持仓数据计算了频率较低的基金盈利能力指标。根据频率较低的指标预测基金未来表现，例如，根据仅有的3到4个观测点预测未来走势。这个问题本身并不是一个容易处理的问题，数据量太小，但是笔者尝试用直线斜率来预测未来走势，得到的预测结果竟然对大多数基金都有用，可是，仍然有部分基金无法预测。笔者希望找到方法降低这部分无法预测的基金比例。深度学习适用于数据量较大的情况，对于小样本的情形无法使用，而元学习适用于小样本问题的解决。除了笔者遇到的情形，元学习可以解决许多小样本的实际问题，例如，任何数据量不足或者任务环境剧烈变化的场景。其实，元学习不仅限于解决小样本问题，其最早提出时是为了实现General AI，让机器学会学习，使得机器可以学会解决小样本问题。元学习的目标是让机器变得更加智能，可以自行解决新问题，而不用每次都收集大量有标注数据、花大量时间和计算资源来从头训练深度模型。

笔者写这本书的愿望如下：（1）期待元学习的发展让机器学会学习，促进General AI的进步，最终让机器从事烦琐的重复性劳动，让人类将精力放在更加重要的领域，让人类的工作变得轻松；（2）元学习算法的框架灵活多变，对任何任务的适应性都不错，可以促进人工智能和传统领域的双赢融合。人工智能的发展并不限于在现有的任务上实现更高精度、更快速度、更好效果，还要将人工智能方法更好地与传统领域结合，扩大人工智能的应用范围，将人工智能渗透到传统领域；（3）希望元学习的思想能促进基础领域研究的发展。通常认为是基础领域研究的进步促进了其他领域的发展，而元学习的思想却可以影响基础领域的理论研究，提高理论的适应性，扩大理论的适应范围，放宽理论成立要求的苛刻假设条件；（4）提供解决问题的新思路。在元学习的基本思想和框架下，可以灵活地组合和改动现有的方法，解决复杂问题，化繁为简，实现问题分解；（5）促进统计学习和深度学习的融合发展，元学习提供了融合这些方法的灵活框架。

本书分为11章，在宏观上可以分为两大部分：元学习方法思想的介绍和元学习应用场景中模型的介绍。第1章是元学习概述，讲述元学习思想的起源和发展脉络；第2章是元学习框架研究，介绍元学习研究中搭建的理论框架，这两章作为对元学习的引入。第3章介绍了元学习神经网络方法，第4章介绍了基于度量的元学习方法，第5章介绍的是基础学习器和元学习器结合的元学习方法，第6章介绍了贝叶斯思想下的元学习方法，这些章节分别介绍了元学习方法的主要框架，给出了元学习框架的基础理论。第7章详细介绍了元学习的实际应用场景，第8章讲述了元强化学习，第9章描述了元模仿学习，第10章介绍了在线元学习，第11章介绍了无监督元学习。这些章节介绍了在实际应用中，在元学习框架下融入了强化学习、模仿学习、在线学习、无监督学习、迁移学习等，实现了对实际应用中深度模型的改进，以适应复杂多变的实际任务。

本书中介绍的方法都来自论文，书中引用的论文列在“论文及扩展阅读.pdf”文件中，该文件可从http://www.broadview.com.cn/40984下载。书中引用论文的编号对应于“论文及扩展阅读.pdf”文件中的编号。

本书正文中提及参见“链接1”“链接2”等时，可从http://www.broadview.com.cn/40984下载“参考资料.pdf”文件，从中可进行查询。

元学习方法灵活多变，可以混搭组合，解决许多实际问题。在不降低模型精度的情况下，提高模型的泛化能力。本书适用于金融领域的样本外预测问题、机器人领域的连续控制问题、小样本图片分类问题等。元学习致力于让机器学会学习，实现更高程度的智能化，以此改进现有模型的效果。