文件名称:SparkStreaming_HBase:将从Kafka收集过来的数据保存到HBase中
文件大小:36KB
文件格式:ZIP
更新时间:2024-05-10 14:35:48
Scala
SparkStreaming_HBase 将从Kafka收集过来的数据保存到HBase中 数据来源:日志生成器。 编写一个python工程,用于产生行为日志,每运行一次,产生所设定的数量数据,使用Linux的定时器,每隔60s执行一次,行为日志保存在文件中。 使用flume对新产生的行为日志进行收集,再用Kafka进行收集、存储,使用SparkStreaming实时处理,最终落到HBase上。 数据格式: /** * 63.132.29.46 2019-10-15 00:36:16 "GET /class/131.html HTTP/1.1" 404 - * 46.98.10.132 2019-10-15 00:36:16 "GET /class/112.html HTTP/1.1" 200 - * 46.29.167.10 2019-10-15 0
【文件预览】:
SparkStreaming_HBase-master
----src()
--------main()
--------test()
----LICENSE(34KB)
----SparkStreamingProject.iml(80B)
----pom.xml(13KB)
----README.md(1KB)
----target()
--------test-classes()
----.idea()
--------misc.xml(513B)
--------encodings.xml(172B)
--------workspace.xml(27KB)
--------scala_compiler.xml(197B)
--------uiDesigner.xml(9KB)
--------hydra.xml(393B)
--------compiler.xml(542B)