文件名称:netflix-prize-exp:Netflix竞赛奖
文件大小:12.22MB
文件格式:ZIP
更新时间:2024-06-10 15:26:29
machine-learning data-mining C++
netflix-prize-exp 使用netflix-prize数据集进行试验 项目文件夹布局 netflixFW:基于C ++构建的框架,用于处理Netflix的漂亮数据集。 一旦加载了所有必要的数据(电影数据库,用户数据库,探针数据库),就可以在合理的RAM限制内顺利进行许多实验。 此文件夹中实现了一些预测变量(基线估计,KNN,SVD)。 随意扩展Algorithm类,以实现自己的预测器算法。 data:包含从数据集中提取的一些有用信息。 这些是使用scripts文件夹中的脚本生成的。 scripts:包含一些最初可用于获取数据集内容的python脚本。 plots:具有一些用于可视化数据集的图形。 即将添加更多图形。 笔记: training_set由于其巨大的大小(〜2.2 GB)而未包含在此文件夹中。 因此,在使用脚本之前,应对脚本和框架中提到的所有“文件/文件夹”
【文件预览】:
netflix-prize-exp-master
----.gitignore(129B)
----data()
--------avgRatingFreqByMovie.txt(72B)
--------user_std_dev.txt(3.83MB)
--------userRatingsMean.txt(9.57MB)
--------avgRatingFreqByUser.txt(85B)
--------indices_K10.txt(932KB)
--------movie_std_dev.txt(137KB)
--------distances_K10.txt(2.34MB)
--------globalAverageRating.txt(102B)
--------probe_converted.txt(9.19MB)
--------avgRatingsOut.txt(237KB)
--------userIdsByAscendingOrder.txt(3.47MB)
--------frequencyOfRatings.txt(115B)
----netflixFW()
--------Config.h(983B)
--------MovieRatings.h(2KB)
--------SVD.h(2KB)
--------Helper.cpp(740B)
--------Makefile(1KB)
--------MovieRatings.cpp(4KB)
--------Helper.h(1KB)
--------Similarity.h(2KB)
--------Similarity.cpp(5KB)
--------Algorithm.cpp(23B)
--------UserRatings.cpp(4KB)
--------ProbeRatings.cpp(5KB)
--------Database.h(883B)
--------Ratings.h(941B)
--------ProbeRatings.h(1KB)
--------BaselinePredictor.h(686B)
--------UserRatings.h(2KB)
--------KNN.h(3KB)
--------Database.cpp(12KB)
--------KNN.cpp(10KB)
--------BaselinePredictor.cpp(2KB)
--------main.cpp(3KB)
--------SVD.cpp(4KB)
--------Algorithm.h(443B)
--------clear(0B)
----scripts()
--------LoadData.py(2KB)
--------RatingsCollection.py(2KB)
--------GlobalEffects.py(5KB)
--------ProbeSetProcessing.py(3KB)
--------LoadSampleData.py(2KB)
--------DatasetPlots.py(5KB)
--------LoadData_backup.py(1KB)
--------GetUserIDs.py(2KB)
--------UserEffects.py(2KB)
--------MovieEffects.py(2KB)
----README.md(2KB)
----plots()
--------avgRatingByMovieFreq.png(12KB)
--------ratingsPie.png(13KB)
--------avgRatingByUserFreq.png(15KB)