github-analysis:基于github存档的github分析

时间:2024-05-18 14:13:15
【文件属性】:

文件名称:github-analysis:基于github存档的github分析

文件大小:46.02MB

文件格式:ZIP

更新时间:2024-05-18 14:13:15

Java

GitHub分析 此仓库专注于分析 下载 我们使用两个脚本从下载github历史数据 # Take year 2016 as example mkdir 2016 python generate_url.py 2016 python download_url.py url2016 2016 120 前处理 我们通过以下步骤预处理github历史数据: 从原始数据中提取[事件,用户,仓库]对。 python preprocess.py 过滤重要用户和存储库。 找到用户和存储库之间的紧密关系。


【文件预览】:
github-analysis-master
----preprocess()
--------evaluate.java(515B)
--------Main.class(2KB)
--------Processing.java(4KB)
--------node.java(303B)
--------Repo.java(5KB)
--------People.java(5KB)
--------Main.java(1KB)
----generate_node_edge.py(4KB)
----node2018.txt(2.02MB)
----mshhhedge2016.txt(18.11MB)
----mshhhnode2015.txt(4.36MB)
----mshhhnode2018.txt(4.29MB)
----node2015.txt(2.19MB)
----git2015node.txt(2.19MB)
----mshhhnode2017.txt(6.19MB)
----mshhhnode2016.txt(6.11MB)
----mshhhedge2018.txt(8.81MB)
----edge2015.txt(2.96MB)
----generate_url.py(643B)
----README.md(556B)
----download_url.py(5KB)
----edge2018.txt(5.06MB)
----mshhhedge2017.txt(16.32MB)
----git2015edge.txt(39.74MB)
----mshhhedge2015.txt(13.4MB)
----preprocess.py(2KB)
----java()
--------preprocess()
----pagerank.sql(5KB)

网友评论