PyFlink 有状态流处理实现实时排行榜

时间:2022-02-21 14:01:38
【文件属性】:

文件名称:PyFlink 有状态流处理实现实时排行榜

文件大小:3.39MB

文件格式:ZIP

更新时间:2022-02-21 14:01:38

flink 实时大数据 kafka

本实例使用 Flink 的有状态流处理和滑动窗口,实现实时点击量排行榜。 该实例统计过去 1 分钟内,点击量最高的男女用户各 10 名及其具体的点击数,同时每隔 1 秒(实时)更新统计结果,等到排行榜数据并将结果同步到 kafka 中。


【文件预览】:
RankList
----flink-sql-connector-kafka_2.11-1.14.0.jar(3.53MB)
----data_producer.py(4KB)
----data_comsumer.py(2KB)
----ranklist.png(257KB)
----ranklist.py(4KB)
----udaf_weightedAvg.py(3KB)
----docker-compose.yml(989B)

网友评论