【文件属性】:
文件名称:wikipedia-separation:计算*页面之间的分离程度
文件大小:36.29MB
文件格式:ZIP
更新时间:2021-05-18 06:23:46
Java
*分离:*上的分离度
该项目旨在使用Neo4j图形数据库来帮助计算Wikipedia页面之间的最短路径(以及其分离程度)。 我们还使用社区检测来使程序能够阻止某些不太有趣的社区出现在找到的路径中。 该项目是为KU Leuven课程“大型社交网络分析”而创建的。
配置
必修课程
或更高版本以运行代码
可以编辑,加载,编译代码。 通过在IntelliJ中打开build.gradle文件来加载存储库,这将加载所有依赖项(例如Spark,GraphX等)
MySQL服务器,例如或
一个在MySQL数据库上运行MySQL查询的程序(例如 )。 该程序用于创建图形数据库所需的CSV文件。
运行图形数据库,该数据库存储该程序中使用的所有*数据。
加载Neo4J图形数据库数据
转换Wikipedia数据转储
对于此项目,将使用Wikipedia数据转储中的三个表: page , p