文件名称:Music-Recommender-last.fm:使用Apache Spark的推荐系统
文件大小:1.59MB
文件格式:ZIP
更新时间:2024-03-31 14:23:51
系统开源
推荐系统-Last.fm 介绍 问题的背景: 对于在媒体流,电子商务等领域开展业务的公司而言,重要的是要了解其客户可能喜欢的内容。 拥有推荐系统可以通过进行个性化推荐来帮助向客户提供个性化体验。 在此项目中,我们可以利用last.fm中的客户数据来构建推荐系统,该系统可以使用监听历史记录和/或用户信息(例如用户年龄,位置,性别等)提供个性化推荐。 除了构建推荐算法之外,我还使用该项目向自己介绍了Apache Spark。 我已经使用了pyspark的ALS工具来构建基于矩阵分解的推荐算法。 除了该算法之外,我还使用k均值聚类来基于用户的年龄,性别和国家/地区汇总数据,从而为没有任何收听历史的用户提供粗略的推荐。 它对谁有用? 音乐流媒体公司 更好的用户参与度 更好的用户保留 顾客 个性化体验 易于使用-自动策划的播放列表/个性化广播 更有可能发现喜欢的新音乐(这就是好的建议的意思!)
【文件预览】:
Music-Recommender-last.fm-master
----Combined_Model.ipynb(10KB)
----Sample_Data_Extraction.ipynb(2KB)
----Data_Exploration.ipynb(167KB)
----Images()
--------signups-per-month-of-the-year.png(9KB)
--------10-most-active-listeners.png(8KB)
--------gender-ratio.png(6KB)
--------age-distribution.png(8KB)
--------signups-per-day-of-the-week.png(9KB)
--------signups-over-months-and-years.png(33KB)
--------top-countries.png(17KB)
--------10-most-popular-artists.png(18KB)
----Plays_per_day.ipynb(31KB)
----README.md(10KB)
----archive()
--------Recommendation_Systems_Basics.ipynb(12KB)
----Recommendation_Systems_Basics.ipynb(12KB)
----Recommender_with_Pyspark.ipynb(13KB)
----Clustering.ipynb(31KB)
----lastfm-dataset-360k-small()
--------merged-subset.csv(1.28MB)
--------merged-subset2.csv(1.31MB)
----Data Cleaning.ipynb(17KB)