Flink-WikipediaEditCount:Apache Flink程序,用于在Wikipedia页面历史xml转储中计算用户的编辑计数

时间:2024-04-20 08:46:51
【文件属性】:

文件名称:Flink-WikipediaEditCount:Apache Flink程序,用于在Wikipedia页面历史xml转储中计算用户的编辑计数

文件大小:262KB

文件格式:ZIP

更新时间:2024-04-20 08:46:51

Java

WikipediaEditCount 这是编写apache flink java程序的练习。 任务是读取Wikipedia XML转储( **-pages-meta-history.xml ),并输出名称空间0中所有页面的作者姓名和编辑计数元组。完整的任务可以在src/doc/Wikipedia author count using Apache Flink.pdf 。 要求 Java 1.8 玛文 Apache Flink (可选7z) 设置 首先,启动本地apache flink实例。 转到您的apache-flink安装目录并运行: $> bin/start-local.sh 然后克隆此存储库: $> git clone https://github.com/gehaxelt/Flink-WikipediaEditCount.git $> cd Flink-Wikipedi


【文件预览】:
Flink-WikipediaEditCount-master
----.travis.yml(113B)
----pom.xml(15KB)
----.github()
--------FUNDING.yml(64B)
----src()
--------test()
--------main()
--------doc()
----LICENSE.md(1KB)
----.gitignore(1KB)
----README.md(3KB)

网友评论