Kubeflow学习指南:生产级机器学习系统实现
上QQ阅读APP看书,第一时间看更新

1.7.3 产品推荐系统

推荐系统是机器学习最常见也最容易理解的应用程序之一,从Amazon的产品推荐系统到Netflix的电影建议系统,有很多例子。大多数推荐系统的实现都基于协同过滤——一种假设,即如果A在一组问题上与B有相同的意见,A会比随机选择的第三人更有可能在其他问题上分享B的意见。这种方法建立在一个完善的算法上,这样的实现有不少,包括TensorFlow/Keras的实现[1]

基于评级的模型的问题之一是,对于具有非缩放目标值的数据,如购买数据或频率数据,它们不容易标准化。这篇优秀的Medium帖子(https://oreil.ly/LncEo)展示了如何将此类数据转换为可用于协同过滤的评级矩阵。我们的例子利用了Data Driven Investor(https://oreil.ly/LncEo)的数据和代码,以及Piyushdharkar的GitHub(https://oreil.ly/p3TB)上描述的代码。我们将用这个例子来探索如何在Jupyter中构建一个初始模型,然后继续构建一个生产Pipeline。

[1] 样例参见Piyushdharkar的GitHub(https://oreil.ly/LFxR9)。