推荐系统
1.推荐系统是什么?
根据用户的历史行为、社交关系、兴趣点、所处上下文环境等去判断用户的当前需求/感兴趣的item。
历史行为:阅读过的新闻(话题/类别)。只有丰富到一定程度上,才没有那么大的随机性
社交关系:对于刚注册的或很久没有登录的用户。比如,用QQ、WX登录获取其关系网,可了解身边人的职业、收入;“人以群分”,他朋友喜欢的,很有可能就是该人喜欢的。
兴趣点:根据其历史行为或注册时填的信息去推荐(注册时会勾选几个感兴趣的话题)
所处上下文环境:假如,依据上述三点原则,挖掘出该用户比较喜欢衬衫。但是,当前该用户一直浏览的是牛仔裤,那么其需求的是牛仔裤,而不是衬衫。
2. 推荐系统的目的
- 寻求解决信息过载的思路
- 商家通过推荐系统盈利,提供个性化服务,增加用户粘性
- 用户通过推荐获得surprise
3. 推荐系统之 系统结构
评价标准:offline model——准确度;online——准确度、速度
4.推荐系统之 评价标准
推荐系统的评价标准主要有:准确度、覆盖率、多样性
4.1准确度
a. 打分系统(电影评分)
设
为用户
对item
的实际评分,
。
RMSE均方根误差衡量观测值和真值的偏差,它是观测值和真值偏差的平方与观测次数n比值的平方根。
b.Top N推荐 (今日头条:item点或不点)
设R(u)用训练集建立的model在训练集上的推荐;T(u)为测试集上用户的选择
准确率(Precision)和召回率(Recall)分别为
其中,红色圆表示R(u),绿色圆表示T(u),两圆相交为A
准确率为: ,召回率为
4.2覆盖率
为了消除马太效应,对物品长尾的发掘能力。
马太效应:推荐的都是hot,用户浏览的也是hot,造成一些冷门item永远无法被推荐。
其中 为商品的数量, 为被推荐的数量; 为第 个商品被推荐的次数/总次数,当 都相等时,熵 才取最大值,从而说明了希望所有商品都有一定的推荐次数。
4.3 多样性
表示推荐列表中物品两两之间的不相似性。比如:推荐100件衬衫,用户也只可能买一件,可以搭配推荐些牛仔裤等。
假设 表示物品i和j的相似度; 为被推荐item的个数; 表示 ,即被推荐的个数。
为被推荐的item个数
4.4其它
除上述评价指标还有:新颖度、信任度和实时性。
参考笔记:
https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247483811&idx=1&sn=fc3ee4ddfc4a8d6014a4cd90cdb5983c