可解释机器学习:黑盒模型可解释性理解指南
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.1.6 线性模型是否有很好的解释

从构成“好的”解释需要的性质来看,线性模型并不能创建最佳解释。它们是对比性的,但是参照实例是构造的一个数据点,其中所有数值特征都为零,分类特征设置为它们的参照类别,这通常是一个人工的、毫无意义的实例,不太可能出现在真实数据或现实中。但有一种例外:如果所有数值特征均以均值为中心(即特征减去特征的平均值),并且所有的分类特征都采用效应编码,那么参照实例就是所有特征取平均特征值的数据点。这也可能是一个不存在的数据点,但至少更有可能或更有意义。在这种情况下,权重乘以特征值解释了与“均值实例”相比,实例的特征对预测结果的贡献。“好的”解释的另一个要求是选择性,这可以在线性模型中通过使用较少的特征或训练稀疏的线性模型来实现。但在默认情况下,只要线性方程是建模特征与结果间关系的合适模型,线性模型就不会创建选择性解释,而是创建真实的解释。非线性和交互作用越多,线性模型越不准确,解释越不真实。线性使得解释更具普遍性和更简单。模型的线性性质是人们使用线性模型解释关系的主要原因。