模型效果和质量的影响因素包括数据的质和量、特征工程质量、模型设计方案等,其中数据的质和量无疑是最具决定性和基础性作用的,所谓“巧妇难为无米之炊”,如果数据的信息域、样本量和信息维度不足,或者数据本身并不具备预测力,则很难建立有效的预测模型。本章将从源数据角度介绍建模的数据基础以及对建模的影响。