【数据挖掘】推荐系统

时间:2023-01-08 16:34:12

概念

个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。
为什么要个性化推荐?
- 商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品
- 浏览大量无关的信息和产品,信息过载问题,用户难以获取所需要的信息

分类

基于内容的推荐

根据用户的历史数据,推荐用户感兴趣的产品。
1. 产品表示:
为每个item 抽取出一些 特征来表示此item;结构化属性如身高、学历、籍贯等;非结构化属性如item自己写的交友宣言,博客内容等等,需要转化成结构化属性
2. 兴趣学习:
利用一个用户过去喜欢(及不喜欢)的item的特征数据,来学习出此用户的喜好特征(profile);典型的有监督分类问题,理论上机器学习里的分类算法都可用
3. 产生推荐:
通过比较上一步得到的用户profile与候选item的特征,为此用户推荐一组相关性最大的item。把模型预测的用户最可能感兴趣的n个item作为推荐返回给用户即可

协同过滤推荐

根据与目标用户兴趣类似的用户预测目标用户对特定产品的喜好程度。
- 以用户作为样本,每个用户对产品的评价作为该用户的特征,寻找最相似的用户。
- 为用户推荐,其最相似用户已经购买、浏览,而该用户未购买、浏览的产品
拓展阅读:协同过滤推荐中SVD分解的应用

优缺点对比

方法 新用户 新商品 冷门商品 特殊商品 潜在兴趣 特征提取、建模 依赖用户
基于内容 × × 需要 ×
协同过滤 × × × × 不需要

- 基于内容的推荐,无法发现用户的潜在兴趣,且对于非结构化特征的数据(电影、音乐等艺术作品)难以准确描述
- 协同过滤推荐,可以发现潜在兴趣,不用提取特征、建模,因此对艺术作品有效;冷启动问题

参考思维导图:推荐系统