统计学习必学的十个问题:理论与实践
上QQ阅读APP看书,第一时间看更新

第1章 防止过拟合

过拟合和欠拟合是机器学习的核心问题,而两个核心问题的理解和解决,衍生出很多机器学习的基本思想。相比较来说,过拟合更应该引起人们的重视,因为欠拟合本身就已经很容易被发现,而过拟合则是模型拟合得足够好,却无法做出有效的预测。过拟合的广为人知的表现就是训练误差小,而测试误差大,如果只是这样理解无法直接为算法设计提供指导,通过本章对理论的解读,我们会发现交叉验证、数据增强和正则化等降低过拟合手段的背后,都隐藏着更深的学习理论。