上QQ阅读APP看书,第一时间看更新
4.2.2 基于标的物的协同过滤
类似地,将与用户操作过的标的物最相似的标的物推荐给用户,就是基于标的物的协同过滤的核心思想。
用户u对标的物s的喜好度sim(u,s)可以采用如下公式计算
其中,S是所有用户操作过的标的物的列表,score(u,si)是用户u对标的物si的喜好度,sim(si,s)是标的物si与s的相似度。
有了用户对每个标的物的评分,基于评分降序排列,就可以取相似度最大的topN标的物推荐给用户了。
从上面的介绍可以看出,协同过滤算法思路非常直观易懂,计算公式也相对简单,并且易于分布式实现(后面两节会介绍),同时该算法也不依赖于用户及标的物的其他metadata信息。协同过滤算法被Netflix、Amazon等大的互联网公司证明效果非常好,能够为用户推荐新颖性内容,所以一直以来都在工业界有非常广泛的应用。