SparkStreaming_HBase:将从Kafka收集过来的数据保存到HBase中

时间:2024-05-10 14:35:48
【文件属性】:

文件名称:SparkStreaming_HBase:将从Kafka收集过来的数据保存到HBase中

文件大小:36KB

文件格式:ZIP

更新时间:2024-05-10 14:35:48

Scala

SparkStreaming_HBase 将从Kafka收集过来的数据保存到HBase中 数据来源:日志生成器。         编写一个python工程,用于产生行为日志,每运行一次,产生所设定的数量数据,使用Linux的定时器,每隔60s执行一次,行为日志保存在文件中。 使用flume对新产生的行为日志进行收集,再用Kafka进行收集、存储,使用SparkStreaming实时处理,最终落到HBase上。 数据格式: /**    * 63.132.29.46 2019-10-15 00:36:16 "GET /class/131.html HTTP/1.1" 404 -    * 46.98.10.132 2019-10-15 00:36:16 "GET /class/112.html HTTP/1.1" 200 -    * 46.29.167.10 2019-10-15 0


【文件预览】:
SparkStreaming_HBase-master
----src()
--------main()
--------test()
----LICENSE(34KB)
----SparkStreamingProject.iml(80B)
----pom.xml(13KB)
----README.md(1KB)
----target()
--------test-classes()
----.idea()
--------misc.xml(513B)
--------encodings.xml(172B)
--------workspace.xml(27KB)
--------scala_compiler.xml(197B)
--------uiDesigner.xml(9KB)
--------hydra.xml(393B)
--------compiler.xml(542B)

网友评论