【文件属性】:
文件名称:svd算法matlab代码-BigDataMining-Analysis:电影推荐
文件大小:29.03MB
文件格式:ZIP
更新时间:2021-05-27 18:25:00
系统开源
svd算法matlab代码大数据挖掘与分析课程项目
电影收视率预测项目
数据集
从movielens
/
ml-1m.zip下载。
该数据集包含来自6000个用户的4000部电影的100万个评分。
我们进一步根据时间戳对每个收视率进行排序
建议:
步骤1:
基线估算器:在PDF上使用公式bxi
=μ+
bx
+
bi
第2步:
邻域估计器:使用邻域方法预测评分分数
基于项目的相似性
基于用户的相似性
整合时间动力
继KDD09论文之后
式5,6,8,10
K均值聚类
使用k均值算法可根据文件rating.dat给出的用户评分得分对用户进行聚类。
SVD降维
使用SVD算法减少维数
指标
RMSE的价值
项目实施
请参阅
推荐部分使用Python编码,其他部分则由我的小组成员使用Matlab编码。
【文件预览】:
BigDataMining-Analysis-master
----数据挖掘文档.pdf(1.69MB)
----ml-1m()
--------.DS_Store(6KB)
--------test_file(2.41MB)
--------ratings.dat(23.45MB)
--------train_file(21.05MB)
--------movies.dat(167KB)
--------users.dat(131KB)
--------README(5KB)
----3()
--------RMSE.txt(472B)
--------SVD.m(2KB)
--------.DS_Store(6KB)
--------result_SVD(3.37MB)
--------3.txt(10B)
--------readme.txt(151B)
----.DS_Store(8KB)
----test_file(2.41MB)
----README.md(1KB)
----2()
--------RMSE(45B)
--------item_cluster_20()
--------code()
--------user_cluster_20()
--------.DS_Store(8KB)
--------result_kMeans(3.37MB)
--------readme.txt(218B)
----train_file(21.05MB)
----1()
--------RMSE(133B)
--------readme(89B)
--------.DS_Store(6KB)
--------result_1_movie(3.37MB)
--------process.py(9KB)
--------result_1_3(3.47MB)
--------result_1_1(3.35MB)
--------result_1_user(3.35MB)