上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第4章 可解释的模型
实现可解释性的最简单方法是只使用创建可解释模型的算法子集。线性回归、逻辑回归和决策树是常用的可解释模型。
接下来将讨论这些模型。这里并没有详细介绍,仅提供基础知识,因为已经有大量书籍、视频、教程、论文可供学习。本书将专注于如何解释模型,详细讨论线性回归、逻辑回归、其他线性回归扩展、决策树、决策规则和RuleFit 算法,并列出了其他可解释的模型。
除k-近邻算法外,本书中所有可解释的模型都可以在模块级别上解释。表4-1描述了可解释的模型的类型及其性质。如果特征和目标之间的关联是线性建模的,那么模型就是线性的。具有单调约束的模型可确保特征和目标结果之间的关系在整个特征范围内始终朝着相同的方向:特征值的增加要么总是导致目标结果的增加,要么总是导致目标结果的减少。单调性对于模型的解释是有用的,因为它使理解关系变得更容易。一些模型可以自动地包含特征之间的交互来预测目标结果。你可以手动创建交互特征,也可以将交互包括在任何类型的模型中。交互可以提高预测性能,但太多或太复杂的交互都会损害可解释性。有些模型只处理回归,有些只处理分类,还有一些两者都处理。
表4-1 可以用来为任务选择合适的可解释模型,无论是回归问题还是分类问题。