推荐系统实战——概述

简介

信息过载的现在,催生出了个性化推荐系统,“千人千面”,分析你的历史兴趣,发现对用户有价值的信息,同时,让信息能够展现在对它感兴趣的用户面前,可谓是双赢的酷事!选择《推荐系统实战》这本书作为自己的入门读物,一步一步深入学习个性化推荐,本文是推荐系统的概述,作为系列开篇之记。

思维导图

下面这张思维导图,可以粗略了解推荐系统是什么,解决什么问题,有什么用(经典三问,是什么?为什么?怎么样?),以及如何评价推荐系统优劣?
recommend

附1:覆盖率——基尼系数计算原理:

结合下图,gini系数的形象化解释为(黑色曲线表示最不热门的x%物品的总流行度占系统的比例y%),$$Gini=\frac{A的面积}{(A+B)的面积} $$
gini
由此可见,如果系统物品流行度分配很不均匀,那么分子就会很大,从而基尼系数也会很大。

附2:一个推荐算法最终上线,需完成3个实验。

  • 离线实验证明他在很多离线指标上优于现有算法;
  • 通过用户调查确定它的用户满意度不低于现有算法;
  • 在线AB测试确定它在我们关心的指标上优于现有算法。

附3:离线实验的优化目标

用一个数学公式表达,如下:
最大化预测准确度
使得 覆盖率 > A,多样性 > B,新颖性 > C

[1]项亮,推荐系统实战.

分享