文件名称:Recsys-Spotify-2018-challenge:我们针对recsys-spotify 2018挑战的解决方案的源代码
文件大小:109KB
文件格式:ZIP
更新时间:2024-05-19 12:10:04
Python
我们针对RecSys 2018挑战赛的代码(最终排行榜第六名) 该存储库包含我们针对RecSys 2018挑战的解决方案的Python源代码。 资料准备 为了将我们提交的内容复制到RecSys 2018挑战赛,您首先需要从赛下载百万播放列表数据集和挑战赛集。 这两个数据集分别记录为JSON文件和压缩为mpd.v1.tgz和challenge.v1.tgz 。 下载完这些文件后,请解压缩它们,然后将解压缩的文件放在一个名为src/data/的新文件夹中。 如果操作正确,则应将“百万播放列表”数据集的JSON文件存储在子文件夹src/data/mpd.v1/data/ ,并将挑战集的JSON文件存储在子文件夹src/data/challenge.v1/ 。 代码结构 数据预处理。 大量的JSON文件对于下游数据操作来说比较麻烦,因此我们首先将它们处理为几个CSV文件,使用的脚本存储在src/
【文件预览】:
Recsys-Spotify-2018-challenge-master
----requirements.txt(131B)
----src()
--------10songs_with_title()
--------5songs_with_title()
--------5songs_without_title()
--------10songs_without_title()
--------1song()
--------title_only()
--------generate_result.py(1KB)
--------utilities()
--------25songs_shuffle()
--------submit()
--------100songs_order()
--------25songs_order()
--------100songs_shuffle()
----LICENSE(11KB)
----README.md(4KB)
----try()
--------word2vec.py(847B)
--------prediction_v12.py(4KB)