机器学习算法实践:推荐系统的协同过滤理论及其应用
上QQ阅读APP看书,第一时间看更新

第一篇 基础理论

推荐系统的传统定义可以理解为“采集用户历史行为信息,结合具体推荐模型帮助用户选择商品或提供建议的过程”。现阶段完整的个性化推荐模型主要由数据收集及预处理、推荐算法和产生推荐三部分组成。

数据收集包括收集用户属性、项目属性和用户对项目的行为信息等。收集到的数据中,有些数据无法直接使用或推荐效果很差。为了后续更好地为用户提供推荐服务,需要提前对数据进行预处理——清理和减噪。

产生推荐是通过推荐算法计算得到目标用户的最近邻集合,将最近邻评价过的项目推荐给目标用户;利用模型对未知项目进行预测,将预测评分最高的项目推送给目标用户。

推荐算法作为个性化推荐系统中的核心,将收集并处理好的数据通过推荐算法为用户产生推荐。推荐算法的优劣与个性化推荐系统的推荐质量有着直接关系。