毕业设计的探索与研究2:有关基于内容推荐算法原理的笔记

时间:2022-12-07 17:28:37
(学习资料来源于网络,如有雷同,纯属学习)
推荐算法:Content Based
作为最基础的算法,基于内容的推荐算法原理理解起来并不难,但是用代码实现就是另外一件事情了,现在只是简单理解一下原理,至于实现的事情今后再慢慢补上。
1. 引入item属性的Content based
a) 结构图如下:
  毕业设计的探索与研究2:有关基于内容推荐算法原理的笔记
b) 引入一组概念:正排表和倒排表
正排表:
Music1:治愈/舒缓/通俗
Music2:摇滚/热血/动感

与之相对应的倒排表是:
治愈:Music1、Music3、Music6…
舒缓:Music1、Music8、Music11…
通俗:Music1、Music19…

通常获取的数据都是属于正排表,所以对于这些数据,需要做的内容分析第一步是:将正排表转换成倒排表
c) 优缺点:
优点:
提升推荐结果的相关性
结果可解释
推荐结果容易被用户感知
缺点:
无个性化
依赖于对item的深度分析
2. 引入User属性的Content based
a) 结构如下
  毕业设计的探索与研究2:有关基于内容推荐算法原理的笔记
b) 优缺点
优点:
用户模型刻画了用户兴趣需求
推荐形式多样,具有个性化
结果可解释
缺点:
推荐精度低
马太效应(用户喜欢看的一直推荐,形成闭环)

用户行为稀疏导致覆盖率低


下一步的学习计划:

1.深入研究协同过滤算法

2.阅读购买书目(明后天到)

3.除算法外,学习其他技术点,如中文分词,mapreduce等