steam-recommendation-system:基于Steam游戏商店中可用的游戏的协同过滤的推荐引擎

时间:2024-06-11 14:34:03
【文件属性】:

文件名称:steam-recommendation-system:基于Steam游戏商店中可用的游戏的协同过滤的推荐引擎

文件大小:21.7MB

文件格式:ZIP

更新时间:2024-06-11 14:34:03

machine-learning correlation collaborative-filtering dataset recommendation-system

蒸汽推荐系统 基于Steam用户库数据集中的协同过滤(皮尔逊相似系数)的推荐系统。 Pandas用于大多数数据操作,其中一些字符串函数用于非Unicode,非字母数字文本清除。 此外,Flask和JS用于前端。 数据整理 在建立此推荐系统时使用了两个数据集。 首先是来自Kaggle的。 这是为了将游戏名称标识为其应用程序ID,这是必需的,因为其他数据集(不包含应用程序ID)以用户每个游戏小时的小时数的形式包含隐式评级。 用户数据集也来自Kaggle。 隐式评级 用户数据集包含每个用户的数据 玩游戏 为了 小时。 我所做的是将隐式的评分时间转换为从1到5的显式评分。 只需将额定值线性映射到范围即可实现 在哪里 是平均游戏小时数 在整个数据集中播放。 端点数据集 此数据集是使用我们数据集中的游戏者的appid与包含游戏标头图像的媒体数据集的内部连接生成的。 该数据集用于检索浏览器中前端的媒


【文件预览】:
steam-recommendation-system-main
----data()
--------correlation_matrix.csv(1.24MB)
--------options.txt(16KB)
--------endpoint_dataset_final.csv(38KB)
--------correlation_matrix(2.12MB)
--------games_in_dataset.csv(8KB)
----Overview.png(33KB)
----assets()
--------default_img3.png(64KB)
--------default_img2.png(65KB)
--------default_img1.png(64KB)
--------default_img4.png(65KB)
--------background1080.jpg(463KB)
--------background1080blurred.jpg(414KB)
--------default_img.png(68KB)
----LICENSE(1KB)
----src()
--------collab_filtering.ipynb(12KB)
--------templates()
--------website.py(3KB)
--------main.ipynb(37KB)
--------data_test.py(970B)
--------string_test.py(1KB)
--------options_syntaxed.py(298B)
----.gitignore(2KB)
----in-progress()
--------final_dataset.csv(564KB)
--------ratings.csv(1.07MB)
--------steam-200k.csv(7.69MB)
--------steam.csv(5.55MB)
----README.md(3KB)
----testing_ground()
--------sanitized_rated.csv(1.02MB)
--------sanitized_steam.csv(686KB)
--------sanitized_steam_using_join.csv(668KB)
--------in-progress()
--------final_dataset1.csv(1MB)
----final_dataset1.csv(1.03MB)

网友评论