推荐算法:Content Based
作为最基础的算法,基于内容的推荐算法原理理解起来并不难,但是用代码实现就是另外一件事情了,现在只是简单理解一下原理,至于实现的事情今后再慢慢补上。
1. 引入item属性的Content based
a) 结构图如下:
b) 引入一组概念:正排表和倒排表
正排表:
Music1:治愈/舒缓/通俗
Music2:摇滚/热血/动感
…
与之相对应的倒排表是:
治愈:Music1、Music3、Music6…
舒缓:Music1、Music8、Music11…
通俗:Music1、Music19…
…
通常获取的数据都是属于正排表,所以对于这些数据,需要做的内容分析第一步是:将正排表转换成倒排表
c) 优缺点:
优点:
提升推荐结果的相关性
结果可解释
推荐结果容易被用户感知
缺点:
无个性化
依赖于对item的深度分析
2. 引入User属性的Content based
a) 结构如下
b) 优缺点
优点:
用户模型刻画了用户兴趣需求
推荐形式多样,具有个性化
结果可解释
缺点:
推荐精度低
马太效应(用户喜欢看的一直推荐,形成闭环)
用户行为稀疏导致覆盖率低
下一步的学习计划:
1.深入研究协同过滤算法
2.阅读购买书目(明后天到)
3.除算法外,学习其他技术点,如中文分词,mapreduce等