第2章中,我们学习了如何使用全连接神经网络去近似非线性函数。这些类型的网络都面临一个主要问题——需要学习的参数太多,这不仅会增加计算时间,还会提升数据过拟合的概率。当我们的模型不能泛化训练数据之外的数据时,会产生过拟合现象,从而导致在新的输入上表现不佳。这是相当危险的,因为你可能将模型投入生产后才意识到过拟合。
有许多不同的神经网络架构可以解决这个问题,其中卷积神经网络(CNN)是计算机视觉领域中最常见的一种。