1.2 最小二乘法_Python机器学习算法: 原理、实现与案例-QQ阅读男频武侠网

Python机器学习算法: 原理、实现与案例

上QQ阅读APP看书，第一时间看更新

上一章目录下一章

1.2　最小二乘法

线性回归模型通常使用均方误差（MSE）作为损失函数，假设训练集有m个样本，均方误差损失函数定义为：

均方误差的含义很容易理解，即所有实例预测值与实际值误差平方的均值，模型的训练目标是找到使得损失函数最小化的。式中的常数并没有什么特殊的数学含义，仅是为了优化时求导方便。

损失函数最小值点是其极值点，可先求对的梯度并令其为0，再通过解方程求得。

计算的梯度：

以上公式使用矩阵运算描述形式更为简洁，设：

那么，梯度计算公式可写为：

令梯度为0，解得：

式中，即为使得损失函数（均方误差）最小的。需要注意的是，式中对求了逆矩阵，这要求是满秩的。然而实际应用中，不总是满秩的（例如特征数大于样本数），此时可解出多个，选择哪一个由学习算法的归纳偏好决定，常见做法是引入正则化项。

以上求解最优的方法被称为普通最小二乘法（Ordinary Least Squares，OLS）。

本周热推：

Python编程：从入门到实践 Python编程：从入门到实践（第2版）C语言从入门到精通（第6版）Java从初学到精通汇编语言简明教程

上一章目录下一章