reporec:基于最近邻居和 minhash 的 Github-repository 推荐系统

时间:2024-06-24 20:14:03
【文件属性】:

文件名称:reporec:基于最近邻居和 minhash 的 Github-repository 推荐系统

文件大小:6KB

文件格式:ZIP

更新时间:2024-06-24 20:14:03

Python

注意:这是一个轻微的失修状态,不能保证下面的说明正常工作。 在终端中运行 reporec 的演示 $ python reporec.py 不幸的是,我无法避免对 mongo 的依赖:( 因为完整的数据库太大而无法压缩,并且从 GHTorrent 下载需要很长时间,我将数据样本作为 json 文件包含在内,该文件将在 reporec.py 的主要函数中解析为 python。 但是 minhash 需要 mongo。 要将 n 个最新的 Watchers 数据集下载并加载到 mongo 中,请运行 $ ./download_data n 其中 n 是整数。 每个数据集大约是 2 个月的数据。 您还可以通过运行导出 userToRepos 数据 $ ./export_user_to_repos.sh


【文件预览】:
reporec-master
----.gitignore(529B)
----export_user_to_repos.sh(146B)
----reporec.py(6KB)
----dbutil.py(1KB)
----download_data.sh(1KB)
----README.md(743B)
----minhash.py(2KB)

网友评论