
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
4.2.2 理论
分类的解决方案是逻辑回归。逻辑回归不是拟合直线或超平面,而是使用逻辑函数将线性方程的输出挤压到0 和1 之间。逻辑函数定义如下:

它看起来如图4-6 所示。
从线性回归到逻辑回归的步骤较为简单。在线性回归模型中,用一个线性方程来建模结果和特征之间的关系:


图4-6 逻辑函数输出0~1 之间的数字
对于分类,倾向于0~1 之间的概率,因此将方程的右边包装成逻辑函数,这将强制输出仅为0 和1 之间的值。

再次回顾一下肿瘤大小的示例,但这次使用的不是线性回归模型,而是逻辑回归模型。
如图4-7 所示,使用逻辑回归进行分类的效果更好,在两种情况下都可以使用0.5 作为阈值,逻辑回归能够根据肿瘤的大小在恶性肿瘤和良性肿瘤之间找到正确的决策边界。附加的点并不会真正影响估计曲线。