PageRank:从*转储文件中查找*中每个页面的 PageRank 的工具

时间:2024-06-22 19:19:22
【文件属性】:

文件名称:PageRank:从*转储文件中查找*中每个页面的 PageRank 的工具

文件大小:4KB

文件格式:ZIP

更新时间:2024-06-22 19:19:22

Java

网页排名 从*转储文件中查找*中每个页面的 PageRank 的工具。同时显示PageRank最高的10位幸存人员。 准备 下载并解压缩*转储文件。 $ ./init.sh 跑步 该程序是用Java编写的。请编译并执行。 $ javac Main.java $ java Main 执行结果保存在data/result.tsv ,格式为PageID \t PageRank \t PageTitle 。 笔记 这个过程非常耗时。它还需要大量内存。几乎没有进行异常处理。如果失败并出现异常,请检查文件是否损坏以及权限是否正常。 执行示例 这是可以正确执行时的输出示例。 Step 1: Parsing `page` table Step 1: Parsed 2527687 objects. Step 1: DONE, 8983ms Step 2: Parsing `pa


【文件预览】:
PageRank-master
----.gitignore(16B)
----init.sh(411B)
----README.md(2KB)
----Main.java(9KB)

网友评论