关于ETL的几种运行

时间:2022-08-07 14:20:02

一:代码部分

1.新建maven项目

2.添加需要的java代码

3.书写mapper类

4.书写runner类

二:运行方式

1.本地运行

2.

3.

三:本地运行方式

1.解压hadoop到本地

  关于ETL的几种运行

2.修改配置文件HADOOP_HOME

  关于ETL的几种运行

3.解压common的压缩包

  关于ETL的几种运行

4.将压缩包的内容拷贝到bin下

  关于ETL的几种运行

5.前提

  在resource中必须存在core和Hbase的site文件

  关于ETL的几种运行

6.上传数据

  新建目录/eventLogs/2015/12/20

  上传到linux

  关于ETL的几种运行

  上传到HDFS

  

7.