从事推荐系统已经快一年了,遇到过很多的茫然不知所措,也踩过不少坑,索性把所有推荐的资料都汇总一下,希望给新人以指引,或者给老司机作为归纳总结
如果电子书链接失效,可以私信我
算法基础
对于推荐系统是需要一些数学和机器学习的基本功的,假设你从来没有接触过机器学习,可以按照下面的步骤进行系统的学习:
数学方面
学习 高数中的求导、概率论整本书、线性代数矩阵计算相关内容,参考的书就是大学的基础教材就行了,也可以阅读《程序员数学系列》,网上都有pdf版,如果找不到下载,可以私信我。
机器学习
首先了解逻辑回归、K近邻、K均值、SVM、贝叶斯等算法,一定要深刻理解梯度下降。
另外需要了解基于SVD的协同过滤算法、FPGrowth频繁相机挖掘。
还有各种相似度的计算,常用的就是欧氏距离(简单暴力)、皮尔森(适合评论评分)、杰卡德(适合离散特征计算)、夹角余弦(适合数值特征计算)。
深度学习
不推荐一上来就用深度学习搞推荐,不容易理解,也不好结合业务。
目前深度学习结合推荐的场景不是很多,大多就是全局推荐或者凑单算法:
- 「推荐系统」领域近期有哪些值得读的论文?| 每周论文清单
- 阿里凑单算法首次公开!基于Graph Embedding的打包购商品挖掘系统解析
- paddlepaddle deep recommendation
博客整理
业界参考
在互联网的时代,如果什么东西都自己研究,那真是闭门造车、浪费生命了,在各大互联网巨头拥抱开源的时候,往往会公开一些系统设计的资料,我们也应该好好利用这些资料,站在巨人的肩膀上做事情。
所以,想要自己做推荐系统,最佳的入门办法就是看看业界是怎么做的。
百分点
今日头条
作为新闻客户端,头条应该算是推荐的佼佼者了,今日头条也公开了内部的算法,让人眼前一亮。
腾讯推荐引擎
腾讯只是找到了一个简单的实时推荐的ppt,由于使用的框架都是自己的,所以参考价值不是很大,这里不得不吐槽一下,腾讯公开的资料真少...扣(鼻)。
阿里云推荐引擎
阿里的推荐引擎由于是对外使用的,所以做的很通用,如果同样想做这样一款产品,可以参考他们的产品设计文档,从数据底层设计到算法组成,到业务配置都很全面。我是从这里面学到不少东西,另外没事多用用淘宝,研究下他们的推荐效果也是很好的学习方式。
推荐文章·持续更新
公众号
名字 | 公众号 | 说明 |
---|---|---|
Java技术 | ImportNew | Java专业文章 |
优秀论文 | paperweekly | 关于AI人工智能方面 |
图灵教育 | turingbooks | 关注经典书籍 |
美团技术 | meituantech | 美团点评技术团队 |
阿里技术 | ali_tech | 国内巨头啊!怎么能不关注! |
基础类
算法类
产品类
论文
-
The Google File System
-
MapReduce: simplified data processing on large clusters
- Bigtable_A Distributed Storage System for Structured Data
- 爱可可-爱生活的微博:经常发高质量论文
- Deep Reinforcement Learning for List-wise Recommendations.pdf
书籍推荐
数学类
- 《高等数学 上册·同济大学第六版》
- 《高等数学 下册·同济大学第六版》
- 《概率论与数理统计·浙江大学第四版》
- 《线性代数·同济大学第五版》
- 《程序员的数学1 高等数学》
- 《程序员的数学2 概率统计》
- 《程序员的数学3 线性代数》