文件名称:Flink-WikipediaEditCount:Apache Flink程序,用于在Wikipedia页面历史xml转储中计算用户的编辑计数
文件大小:262KB
文件格式:ZIP
更新时间:2024-04-20 08:46:51
Java
WikipediaEditCount 这是编写apache flink java程序的练习。 任务是读取Wikipedia XML转储( **-pages-meta-history.xml ),并输出名称空间0中所有页面的作者姓名和编辑计数元组。完整的任务可以在src/doc/Wikipedia author count using Apache Flink.pdf 。 要求 Java 1.8 玛文 Apache Flink (可选7z) 设置 首先,启动本地apache flink实例。 转到您的apache-flink安装目录并运行: $> bin/start-local.sh 然后克隆此存储库: $> git clone https://github.com/gehaxelt/Flink-WikipediaEditCount.git $> cd Flink-Wikipedi
【文件预览】:
Flink-WikipediaEditCount-master
----.travis.yml(113B)
----pom.xml(15KB)
----.github()
--------FUNDING.yml(64B)
----src()
--------test()
--------main()
--------doc()
----LICENSE.md(1KB)
----.gitignore(1KB)
----README.md(3KB)