文件名称:Netflix评级:使用现有数据预测新电影的评级
文件大小:700KB
文件格式:ZIP
更新时间:2024-03-11 22:28:31
Python
Netflix评级 要求: 要运行此项目,您需要Python 3.x和以下python软件包: 脾气暴躁的 西皮 CSV 大熊猫 资料集: 培训数据集包含功能/属性的100万笔交易/记录(用户-电影对): <影片ID,客户ID,评级,推荐日期>作为您的培训集以及 <电影ID,发布日期的电影名称>的另一个数据集。 观察与结论: 由于评分是1-5,并且仅在我们将新生成的预测用于其他功能(如电影评分的推荐和标准化)时才可以使用整数,因此这两种方法的结果非常相似。 但是,由于我们拥有的训练集非常稀疏,因此频谱聚类方法的效果相对较差。 有一种情况,在某个群集c中,没有人给电影j评分,因此预测值仅为3(默认值)。 这是非常不合理的,因此我们必须减小k的值以缓解它。 但是,使用较小的k值也会带来副作用,即,没有足够的群集来分离行为不同的用户。 最后,许多用户可能具有相似的预测值。 我认为这是
【文件预览】:
Netflix-rating-master
----README.md(2KB)
----matrix()
--------ChuyuanQu_preds_matrix.txt(1.4MB)
--------matrixcom.py(2KB)
--------ReadMe for MatCom(2KB)
----clustering()
--------clustering.py(3KB)
--------ReadMe For Clustering(2KB)
--------ChuyuanQu_preds_clustering.txt(1.28MB)