- 源系统中的每个可能的值都需要映射
- 要映射到唯一的一组值。
create table lkp_codes ( id int primary key,为了便于查询,数据是以非正规的结构来组织。但这种结构适合要求,而且容易查询,根据源系统的名称和原始的数据,就能查询到标准的三个值:M、F、U。
ref_code varchar(1),
ref_name varchar(10),
src_system varchar(10),
src_code varchar(10)
) engine=myisam;
insert into lkp_codes values(1,'M','Male','Sales','1');
insert into lkp_codes values(2,'F','Female','Sales','2');
insert into lkp_codes values(3,'M','Male','Web','male');
insert into lkp_codes values(4,'F','Female','Web','female');
insert into lkp_codes values(5,'M','Male','CRM','F');
insert into lkp_codes values(6,'F','Female','CRM','M');
insert into lkp_codes values(7,'U','Unknown','CRM','C');
主转换流程的结构如下:
要给子转换步骤定义一个变量,在映射步骤“参数”标签下设置变量。在这个例子里,把值为Web的变量传递给子转换genderlookup。
在子转换里使用这个变量:
子转换里的流查询步骤非常简单:只需设置好条件,输入数据的src_code1等于参照表的src_code字段,并指定要返回的字段即可。注意这里必须要设置一个默认值,来处理NULL和未知的值。完整的流查询步骤如下:
说明:原始数据里可能会包含NULL值,但NULL并不是数据库里的一个真正的值。NULL=NULL这样的比较条件也不会成功。这就是为什么没有把对NULL值的匹配放到参照表里,以及为什么在流查询步骤里一定要设置一个默认值的原因。