搭建基于DataX的可视化界面

时间:2024-03-12 22:49:49

一、内容简介

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。但是我们在使用的过程中,需要将Json配置文件放到DataX的job路径下,随着业务的增加,配置文件不方便管理和迁移并且每次执行都需要记录命令。 下面介绍搭建基于DataX的可视化界面。

二、部署前准备

1、阿里的开源同步工具datax3.0
2、语言Java 8
3、数据库Mysql5.7
4、datax-web(项目地址:https://github.com/WeiYe-Jing/datax-web)

三、部署步骤

1、安装datax
下载datax

git cloune https://github.com/alibaba/DataX.git

编译datax,这里编译需要maven,安装不再累述

mvn -U clean package assembly:assembly -Dmaven.test.skip=true

编译完成后,可以验证一下

cd DataX/target/datax/datax/bin

python datax.py …/job/job.json

2、安装jdk

yum install java-1.8.0-openjdk

3、安装数据库5.7
下载源

wget https://dev.mysql.com/get/mysql57-community-release-el7-9.noarch.rpm

安装repo

rpm -ivh mysql57-community-release-el7-9.noarch.rpm

安装mysql5.7

yum install mysql-server

4、安装datax-web
下载源码

git clone https://github.com/WeiYe-Jing/datax-web.git

执行sql

cd datax-web/doc/db,在mysql中执行datax_web.sql

修改datax-admin配置文件

vi datax-web/datax-admin/src/main/resources/application.yml
搭建基于DataX的可视化界面

修改datax-executor配置文件

vi datax-executor/src/main/resources/application.yml
搭建基于DataX的可视化界面

四、验证使用

启动datax-admin

java -Xmx1024M -Xms1024M -Xmn448M -XX:MaxMetaspaceSize=192M -XX:MetaspaceSize=192M -jar datax-admin-2.1.0.jar --server.port=8080 >> admin.log &

启动datax-executo

java -Xmx1024M -Xms1024M -Xmn448M -XX:MaxMetaspaceSize=192M -XX:MetaspaceSize=192M -jar datax-executor-2.1.0.jar >> executor.log &

检查端口是否起来

netstat -nuplt
搭建基于DataX的可视化界面

可以看到已经成功启动,现在在浏览器输入地址查看
http://IP:8080/index.html#/dashboard
默认账号密码为admin/123456