Dummy步骤不会做任何事情。它的主要功能是作为以测试为目的的占位符。
追加流
分析查询(前后行查询),步骤:增加常量数据包括id,name连个字段,增加自增列autoid字段,按id,outid进行升序排列,使用分析查询,按ID分组获取每行的前后行数据
阻止执行直到某步骤执行完
分组
计算器
判断字段是否存在
判断表是否存在
克隆行(一行数据,增加了序列,克隆两条,变为三条记录,Y表示克隆行)
Closure Generator=结束操作
=允许利用ID的父子关系生成一个结束表
联合查询更新(更新维度表)
步骤错误处理设置
过滤记录
字段的校验,通过增加多个校验,可以校验多个字段
行延迟(每行延迟1S)
去重
在不做排序的情况下:
按ID排序后去重:
字段加密:
//Script here
var encrypted_password = 'not encrypted';
encrypted_password = "Encrypted " + Packages.org.pentaho.di.core.encryption.Encr.encryptPassword(clear_password);
Excel输入(以sample-file.xls的工作表sheet1为例)
sheet1的内容如下:
浏览选择sample-file.xls,点击添加按钮
可以手动录入,也可以通过选择工作表名称按钮添加工作表,注意其实行起始列,因为sheet1中,从第一行,第一列开始有数据,因此起始行起始列为1;
内容标签中,如果首行为列头,则选择头部。
可以点击获取头部的字段来获取字段名称
excel输出(生成记录导出到excel)
字段拆分
拆分字段的合并(通过计算器进行合并,计算后移除中间字段)