kettle-定时任务
Kettle 的定时任务可以用kettle中的job工作来定时转换(缺点窗口不可关闭),同时也可以使用bat脚本来启动kettle的 ‘.ktr’转换。
注:这里对定时任务的时间间隔做一个解释,job定时任务选择时间间隔,是你的job执行结束后,然后在等待你设置的时间以后才会执行下一个job(因为数据量大时一个job可能执行很长时间)。
这里对Bat脚本执行做重点介绍
Bat脚本可在 Windows上直接双击运行;也可以在‘计算机管理-->任务计划程序中添加,并定时启动;还可以在 Windows点击运行,输入cmd,在dos窗口输入命令启动。在Linux环境下启动转换的方法与Windows上差不多,所以并未多做实验。
cd C:\Users\ZCX\Desktop\pdi-ce-7.1.0.0-12\data-integration\
kitchen.bat /file:C:\Users\ZCX\Desktop\GateDataJob.kjb /level:Basic>>D:\kettle\log\kettle_%date:~0,4%%date:~5,2%%date:~8,2%.log
在日志目录每天会生成一个日志文件。
具体参数说明请参考下表。
Kettle-Pan命令参数列表
参数名称 | 含义 |
---|---|
/rep | 资源库名称 |
/user | 资源库用户名 |
/pass | 资源库密码 |
/trans | 要启动的转换名称 |
/dir | 目录 |
/file | 要启动的转换文件 |
/level | 日志级别(Error、Nothing、Minimal、Basic、Detailed、Debug、Rowelevel) |
/logfile | 要写入的日志文件 |
/listdir | 列出资源库的目录 |
/listtrans | 列出指定目录下的转换 |
/listrep | 列出可用资源 |
/exprep | 将资源库里的所有对象导出到XML文件中 |
/norep | 不要将日志写到资源库中 |
/safemode | 安全模式下运行,有额外检查 |
/version | 显示转换版本 |
/param | 设置参数,参数格式 |
/listparam | 列出转换里已经设置好的参数 |
/maxloglines | 内存中保存日志的最大日志行数 |
/maxlogtimeout | 内存中保存日志的最大时间 |
kettle-kitchen命令参数列表
参数名称 | 含义 |
---|---|
/rep | 资源库名称 |
/user | 资源库用户名 |
/pass | 资源库密码 |
/job | 要启动的作业名称 |
/dir | 目录 |
/file | 要启动的转换文件 |
/level | 日志级别(Error、Nothing、Minimal、Basic、Detailed、Debug、Rowelevel) |
/logfile | 要写入的日志文件 |
/listdir | 列出资源库的目录 |
/listjobs | 列出指定目录下的作业 |
/listrep | 列出可用资源 |
/norep | 不要将日志写到资源库中 |
/version | 显示转换版本 |
/param | 设置参数,参数格式 |
/listparam | 列出转换里已经设置好的参数 |
/maxloglines | 内存中保存日志的最大日志行数 |
/maxlogtimeout | 内存中保存日志的最大时间 |
/export | 把作业依赖的所有资源导出到一个zip文件里 |