kettle 常用组件

时间:2022-10-19 10:10:05

Dummy步骤不会做任何事情。它的主要功能是作为以测试为目的的占位符。

kettle 常用组件

追加流

kettle 常用组件

分析查询(前后行查询),步骤:增加常量数据包括id,name连个字段,增加自增列autoid字段,按id,outid进行升序排列,使用分析查询,按ID分组获取每行的前后行数据

kettle 常用组件

kettle 常用组件

阻止执行直到某步骤执行完

kettle 常用组件

kettle 常用组件

kettle 常用组件

分组

kettle 常用组件

计算器

kettle 常用组件

判断字段是否存在

kettle 常用组件

判断表是否存在

kettle 常用组件

克隆行(一行数据,增加了序列,克隆两条,变为三条记录,Y表示克隆行)

kettle 常用组件

Closure Generator=结束操作
=允许利用ID的父子关系生成一个结束表

kettle 常用组件

联合查询更新(更新维度表)

kettle 常用组件

步骤错误处理设置

kettle 常用组件

过滤记录

kettle 常用组件

字段的校验,通过增加多个校验,可以校验多个字段

kettle 常用组件

行延迟(每行延迟1S)

kettle 常用组件

去重

kettle 常用组件

在不做排序的情况下:

kettle 常用组件

按ID排序后去重:

kettle 常用组件

字段加密:

//Script here

var encrypted_password = 'not encrypted';

encrypted_password = "Encrypted " + Packages.org.pentaho.di.core.encryption.Encr.encryptPassword(clear_password);

kettle 常用组件

Excel输入(以sample-file.xls的工作表sheet1为例)

sheet1的内容如下:

kettle 常用组件

浏览选择sample-file.xls,点击添加按钮

kettle 常用组件

可以手动录入,也可以通过选择工作表名称按钮添加工作表,注意其实行起始列,因为sheet1中,从第一行,第一列开始有数据,因此起始行起始列为1;

内容标签中,如果首行为列头,则选择头部。

kettle 常用组件

可以点击获取头部的字段来获取字段名称

kettle 常用组件

excel输出(生成记录导出到excel)

kettle 常用组件

字段拆分

kettle 常用组件

拆分字段的合并(通过计算器进行合并,计算后移除中间字段)

kettle 常用组件