文件名称:matlab代码影响-movie-recommendations:协同过滤应用于MovieLens数据集
文件大小:2.53MB
文件格式:ZIP
更新时间:2024-06-11 02:05:19
系统开源
matlab代码影响电影推荐 该资料库包含用Matlab编写的协作过滤推荐算法,该算法适用于。 MovieLens数据集 我决定要使用MovieLens数据集,因为它包含所有最新电影,所以我想自己尝试一下。 数据集已经整理好-我已经生成了新的电影ID以消除差距并更新了相应的评分,因此我可以在Matlab中更轻松地使用它们。 用户数:668 电影数量:10.329 评分的数量:105.339 每个用户平均评价158部电影 我使用了Coursera机器学习课程中的一些现有代码,主要用于计算成本函数。 参数 我了解到,调整以下参数会影响成本函数的值: 功能数量:较大的值可防止拟合不足 正则化:较大的值可防止过度拟合 模型将学习的特征数量会影响它将从数据集中收集多少信息。 我尝试在模型上使用30到60个功能。 使用50个特征来训练模型恰好是最合适的。 选择正则化参数lambda时,较小的值可能导致过度拟合或高方差。 当模型的成本函数值非常低,但不能很好地概括时,就是这种情况。 我尝试了从0.3到3.0的lambda值,使用1.0是最合适的。 测试? 我通过插入一些我看过的电影并对他们的评分来评
【文件预览】:
movie-recommendations-master
----README.md(2KB)
----dataset()
--------movies.csv(504KB)
--------tags.csv(194KB)
--------ratings.csv(2.46MB)
--------new_ratings.csv(1.26MB)
--------links.csv(203KB)
--------README.txt(8KB)
--------csv_to_txt.rb(1KB)
--------movies.txt(318KB)
----results()
--------lambda03-feature50-iter200-cost2.28e+4.svg(28KB)
--------lambda3-feature40-iter200-cost1.37e+4.svg(25KB)
--------lambda3-feature30-iter200-cost1.5e+4.svg(28KB)
--------lambda1-feature60-iter200-cost5.06e+3.svg(25KB)
--------lambda1-feature30-iter200-cost8.05e+3.svg(27KB)
--------lambda03-feature60-iter200-cost2.58e+4.svg(25KB)
--------lambda3-feature50-iter200-cost1.3e+4.svg(27KB)
--------lambda10-feature30-iter200-cost2.89e+4.svg(27KB)
--------lambda1-feature50-iter200-cost5.52e+3.svg(25KB)
--------lambda03-feature40-iter200-cost2.08e+4.svg(23KB)
--------dataset.svg(77KB)
--------lambda03-feature30-iter200-cost2.59e+4.svg(27KB)
--------lambda1-feature40-iter200-cost6.45e+3.svg(28KB)
----matlab_scripts()
--------loadRatings.m(446B)
--------collaborativeFiltering.m(3KB)
--------new_ratings.csv(1.26MB)
--------loadMovies.m(485B)
--------movie_data.mat(651KB)
--------fmincg.m(9KB)
--------costFunction.m(970B)
--------importRatings.m(1KB)
--------normalizeRatings.m(479B)
--------movies.txt(318KB)