上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
4.1.2 示例
在此示例中,在给定天气和日历信息的情况下,使用线性回归模型预测特定日期的自行车租赁数量。为了便于解释,这里检查了估计的回归权重。这些特征包括数值特征和分类特征。对于每个特征,表4-2 显示估计的权重、估计的SE 和t-统计量的绝对值(|t|)。
数值特征(例如“温度”)的解释:当所有其他特征保持不变时,将温度升高1°C,自行车的预测数量增加110.7。
分类特征(例如“天气情况”)的解释:与晴天相比,当为雨雪天气时,自行车的预测数量减少了1901.5;再次假设所有其他特征不变,当天气为雾时,自行车的预测数量比正常天气少了379.4。
所有的解释总是伴随“所有其他特征保持不变”,这是由线性回归模型的性质决定的。预测目标是加权特征的线性组合。估计的线性方程是特征/目标空间中的超平面(或在单个特征的情况下为直线)。权重指定每个方向上超平面的斜率(或梯度)。可加性将单个特征的解释与所有其他特征隔离开来。这是可能的,因为方程式中的所有特征效应(等于权重乘以特征值)都是用加号组合在一起的。但这种解释忽略了特征的联合分布,即只增加一个特征,且不改变另一个特征,这可能不合实际或者是不太可能的数据点。例如,如果不增加房屋面积,却增加房间数量可能就是不现实的。