构建企业级推荐系统:算法、工程实现与案例分析
上QQ阅读APP看书,第一时间看更新

5.3.1 基于用户聚类的推荐

如果我们将所有用户聚类了,就可以将该用户所在类别的其他用户操作过的标的物(但是该用户没有操作行为)推荐给该用户。具体计算公式如下,其中Rec(u)是给用户u的推荐,H是用户所在的聚类,A(u')、A(u)分别是用户u'、u的操作历史集合。

那么怎么对用户聚类呢?可行的方案主要有如下几类。

1.基于用户的人口统计学特征对用户聚类

用户的年龄、性别、地域、家庭组成、学历、收入等信息都可以作为一个特征,类别特征可以采用one-hot编码,所有特征最终都可以转化为数值,最终获得用户特征的向量表示,通过K-Means聚类算法对用户聚类。

2.基于用户行为对用户聚类

比如采用矩阵分解就可以获得用户的嵌入表示,用户操作行为矩阵的行向量也是用户的一种向量表示,再利用K-Means对用户进行聚类。

3.基于社交关系对用户聚类

如果是社交产品,用户之间的社交链条可以构成一个用户关系图,该社交图中所有的连通区域就形成了用户的一种聚类。这种推荐其实就是将你的好友喜欢的标的物推荐给你。