[推荐系统]--什么是推荐系统

时间:2022-12-07 19:15:14

推荐系统

1.推荐系统是什么?

根据用户的历史行为、社交关系、兴趣点、所处上下文环境等去判断用户的当前需求/感兴趣的item。
历史行为:阅读过的新闻(话题/类别)。只有丰富到一定程度上,才没有那么大的随机性
社交关系对于刚注册的或很久没有登录的用户。比如,用QQ、WX登录获取其关系网,可了解身边人的职业、收入;“人以群分”,他朋友喜欢的,很有可能就是该人喜欢的。
兴趣点:根据其历史行为注册时填的信息去推荐(注册时会勾选几个感兴趣的话题)
所处上下文环境:假如,依据上述三点原则,挖掘出该用户比较喜欢衬衫。但是,当前该用户一直浏览的是牛仔裤,那么其需求的是牛仔裤,而不是衬衫。

2. 推荐系统的目的
  1. 寻求解决信息过载的思路
  2. 商家通过推荐系统盈利,提供个性化服务,增加用户粘性
  3. 用户通过推荐获得surprise
3. 推荐系统之 系统结构

[推荐系统]--什么是推荐系统
评价标准:offline model——准确度;online——准确度、速度

4.推荐系统之 评价标准

推荐系统的评价标准主要有:准确度、覆盖率、多样性

4.1准确度

a. 打分系统(电影评分)
r u i 为用户 u 对item i 的实际评分, r ^ u i
RMSE均方根误差衡量观测值和真值的偏差,它是观测值和真值偏差的平方与观测次数n比值的平方根。

R M S E = u , i T ( r u i r ^ u i ) 2 | T |

b.Top N推荐 (今日头条:item点或不点)
设R(u)用训练集建立的model在训练集上的推荐;T(u)为测试集上用户的选择
准确率(Precision)和召回率(Recall)分别为
P r e c i s i o n = u U | R ( u ) T ( u ) | u U | R ( u ) |

R e c a l l = u U | R ( u ) T ( u ) | u U | T ( u ) |

[推荐系统]--什么是推荐系统
其中,红色圆表示R(u),绿色圆表示T(u),两圆相交为A
准确率为: A R ( u ) ,召回率为 A T ( u )

4.2覆盖率

为了消除马太效应,对物品长尾的发掘能力。
[推荐系统]--什么是推荐系统
马太效应:推荐的都是hot,用户浏览的也是hot,造成一些冷门item永远无法被推荐。

C o v e r a g e = | U u U R ( u ) | | I |
H = i = 1 n p ( i ) · l o g p ( i )

其中 I 为商品的数量, R ( u ) 为被推荐的数量; p ( i ) 为第 i 个商品被推荐的次数/总次数,当 p ( i ) 都相等时,熵 H 才取最大值,从而说明了希望所有商品都有一定的推荐次数。

4.3 多样性

表示推荐列表中物品两两之间的不相似性。比如:推荐100件衬衫,用户也只可能买一件,可以搭配推荐些牛仔裤等。

D i v e r s i t y ( R ( u ) ) = 1 i , j R ( u ) , i j s ( i , j ) 1 2 | R ( u ) | ( | R ( u ) | 1 )
D i v e r s i t y = 1 | U | u u D i v e r s i t y ( R ( u ) )

假设 s ( i , j ) 表示物品i和j的相似度; | R ( u ) | 为被推荐item的个数; 1 2 | R ( u ) | ( | R ( u ) | 1 ) 表示 C | R ( u ) | 2 ,即被推荐的个数。
| U | 为被推荐的item个数

4.4其它

除上述评价指标还有:新颖度、信任度和实时性。
参考笔记:
https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247483811&idx=1&sn=fc3ee4ddfc4a8d6014a4cd90cdb5983c