文件名称:PyFlink 有状态流处理实现实时排行榜
文件大小:3.39MB
文件格式:ZIP
更新时间:2022-02-21 14:01:38
flink 实时大数据 kafka
本实例使用 Flink 的有状态流处理和滑动窗口,实现实时点击量排行榜。 该实例统计过去 1 分钟内,点击量最高的男女用户各 10 名及其具体的点击数,同时每隔 1 秒(实时)更新统计结果,等到排行榜数据并将结果同步到 kafka 中。
【文件预览】:
RankList
----flink-sql-connector-kafka_2.11-1.14.0.jar(3.53MB)
----data_producer.py(4KB)
----data_comsumer.py(2KB)
----ranklist.png(257KB)
----ranklist.py(4KB)
----udaf_weightedAvg.py(3KB)
----docker-compose.yml(989B)