推荐系统实战——架构

简介

推荐系统的核心任务可拆解成两部分,一个是如何为给定用户生成特征,另一个是如何根据特征找到物品。用户特征包括,人口统计学特征用户行为特征用户话题特征。本文是具体的基于物品的推荐算法系统的架构学习笔记。

推荐系统架构图

recsys_arich

生成用户特征向量

  • 用户行为的种类,一般的标准就是用户付出代价越大的行为权重越高;
  • 用户行为产生的时间,一般来说,用户近期的行为比较重要,而用户很久之前的行为相对比较次要;
  • 用户行为的次数,用户对同一个物品的同一种行为发生的次数也反映了用户对物品的兴趣,行为次数多的物品对应的特征权重越高;
  • 物品的热门程度,加重不热门物品对应的特征的权重。

特征—物品相关推荐

可以离线计算很多相关表,在线服务启动时会将这些相关表按照配置的权
重相加,得到最终的相关表保存在内存中,而在给用户进行推荐时,用的是加权后的相关表。

过滤模块

  • 用户已经产生过行为物品
  • 候选物品以外的物品
  • 某些质量很差的物品

排名模块

  • 新颖性排名,尽量推荐他们不知道的、长尾中的物品,热门的物品进行降权;
  • 多样性;
  • 时间多样性;
  • 用户反馈,点击率预测。
分享