
kafka.etl.topic:topic的名称 hdfs.default.classpath.dir:hdfs的类路径 input:HDFS的输入路径 output:HDFS的输出路径 2.生成topic的offset 执行命令./run-class.sh kafka.etl.impl.DataGenerator test/test.properties,会在HDFS的/tmp/kafka/data目录下生成.dat的文件 3.复制kakfa的相关jar到HDFS的类路径 执行命令./copy-jars.sh /usr/lib/hadoop/lib 4.运行hadoop job ./run-class.sh kafka.etl.impl.SimpleKafkaETLJob test/test.properties,该job会将kafka中test-topic该话题的消息写入HDFS中。 在HDFS的/tmp/kafka/output目录中我们会看到写入的消息。