kettle学习笔记(三)— 定时任务的脚本执行

时间:2024-01-27 14:54:24

kettle-定时任务

Kettle 的定时任务可以用kettle中的job工作来定时转换(缺点窗口不可关闭),同时也可以使用bat脚本来启动kettle的 ‘.ktr’转换。

注:这里对定时任务的时间间隔做一个解释,job定时任务选择时间间隔,是你的job执行结束后,然后在等待你设置的时间以后才会执行下一个job(因为数据量大时一个job可能执行很长时间)。

这里对Bat脚本执行做重点介绍

Bat脚本可在 Windows上直接双击运行;也可以在‘计算机管理-->任务计划程序中添加,并定时启动;还可以在 Windows点击运行,输入cmd,在dos窗口输入命令启动。在Linux环境下启动转换的方法与Windows上差不多,所以并未多做实验。

cd C:\Users\ZCX\Desktop\pdi-ce-7.1.0.0-12\data-integration\
kitchen.bat   /file:C:\Users\ZCX\Desktop\GateDataJob.kjb /level:Basic>>D:\kettle\log\kettle_%date:~0,4%%date:~5,2%%date:~8,2%.log

在日志目录每天会生成一个日志文件。


具体参数说明请参考下表。

Kettle-Pan命令参数列表

参数名称 含义
/rep 资源库名称
/user 资源库用户名
/pass 资源库密码
/trans 要启动的转换名称
/dir 目录
/file 要启动的转换文件
/level 日志级别(Error、Nothing、Minimal、Basic、Detailed、Debug、Rowelevel)
/logfile 要写入的日志文件
/listdir 列出资源库的目录
/listtrans 列出指定目录下的转换
/listrep 列出可用资源
/exprep 将资源库里的所有对象导出到XML文件中
/norep 不要将日志写到资源库中
/safemode 安全模式下运行,有额外检查
/version 显示转换版本
/param 设置参数,参数格式=
/listparam 列出转换里已经设置好的参数
/maxloglines 内存中保存日志的最大日志行数
/maxlogtimeout 内存中保存日志的最大时间

kettle-kitchen命令参数列表

参数名称 含义
/rep 资源库名称
/user 资源库用户名
/pass 资源库密码
/job 要启动的作业名称
/dir 目录
/file 要启动的转换文件
/level 日志级别(Error、Nothing、Minimal、Basic、Detailed、Debug、Rowelevel)
/logfile 要写入的日志文件
/listdir 列出资源库的目录
/listjobs 列出指定目录下的作业
/listrep 列出可用资源
/norep 不要将日志写到资源库中
/version 显示转换版本
/param 设置参数,参数格式=
/listparam 列出转换里已经设置好的参数
/maxloglines 内存中保存日志的最大日志行数
/maxlogtimeout 内存中保存日志的最大时间
/export 把作业依赖的所有资源导出到一个zip文件里