Oracle中解析XMLType格式字段

时间:2023-03-08 15:34:14

背景:项目从某数据交换平台获取XML数据,以Oracle的XMLType格式保存在数据库字段中,需要建立触发器、存储过程,在保存数据时解析XML字段,将数据写入其他业务表中。

参考资料:Oracle的XMLType操作文档,地址为https://docs.oracle.com/cd/B19306_01/appdev.102/b14259/xdb04cre.htm#sthref465

要点总结:

(一)使用SQL语句操作XMLType格式字段的3个主要方法

  (1)existsNode(XMLType实例,XPATH表达式)

  1.功能:

  需要用在where条件中,通过XPATH表达式在传入的XMLType实例中进行查询,如果实例中有符合表达式的节点,则函数返回1,否则返回0

  2.使用方法:

  select * from loginkcn_maritime_manifest where existsNode(xml,'/Root/Header/DocumentName')=1 and id='0272AB47DEDD450FBD06CA07463F245A';

  函数中的"xml"为保存XMLType数据的字段名,id为普通varchar2字段,此时existsNode作为where条件的一项来使用,可以筛选出表中的记录

  (2)extract(XMLType实例,XPATH表达式)

  1.功能:

  需要用在select之后,from之前,用于对查询出的XMLType字段的值进行进一步提取,从而获得新的XMLType格式的结果

  2.使用方法:

  select extract(xml,'/Root/Body/ContainerInfo') from loginkcn_maritime_manifest where existsNode(xml,'/Root/Header/DocumentName')=1 and                       id='0272AB47DEDD450FBD06CA07463F245A';

  在通过existsNode()方法筛选出记录的基础上,通过extract方法提取出Root节点下,Body子节点中所有ContainerInfo节点的信息,作为一个新的XMLType类型的结果值

  3.注意:

  如果在存储过程中,可以传入一个XMLType的变量,此时只需要使用select extract('传入的XMLType变量','XPATH表达式') into '提取出的XMLType变量' from dual;的形式,来将传入的变量进一步进行提取并保存到新的变量中。

  得到的新的XMLType结果可以应用到之后的进一步操作中。

  (3)extractValue(XMLType实例,XPATH表达式)

  1.功能:extractValue()方法和extract()方法类似,只不过得到数据类型的是节点的具体值,而不是XML节点类型,相当于extract.getStringVal(),通过此方法可以直接得到具体节点值,用来进行下一步操作,如insert到其他表中,此方法是最为常用的方法。

  2.使用方法:

  select extractValue(xml,'/Root/Body/ContainerInfo/ContainerNumber[1]') from loginkcn_maritime_manifest where existsNode(xml,'/Root/Header/DocumentName')=1 and                id='0272AB47DEDD450FBD06CA07463F245A';

  3.注意:

  此方法只能提取出单个节点的值,不能同时提取多个相同节点的值。

  如果要一个节点中有多个重复的子节点,则需要通过XMLSquence转化先将XMLType数据转换为Table,然后才能以表的形式获取所有的子节点值,进而使用到游标循环等操作中(详细使用见下方)。

(二)对提取出的XML数据进行转换的2种方法

  (1)XMLSequence(XMLType实例)

  1.功能:

  XMLSequence接收一个XMLType实例(可以用extract函数从数据库中导出并提取),按照实例中的顶层节点返回一个XMLType数组。配合Oracle的table()函数,可以将XMLType数组按照表的形式进行查询,然后可以进行count(*)、使用游标循环等操作。

  2.使用方法:

  select count(*) from table(XMLSequence(extract((select xml from loginkcn_maritime_manifest where        id='0272AB47DEDD450FBD06CA07463F245A'),'/Root/Body/ContainerInfo/ContainerNumber')));

  3.注意:

  XMLSequence需要和table()函数组合使用,效果和XMLTable类似

  table函数的应用 表函数可接受查询语句或游标作为输入参数,并可输出多行数据

  (2)XMLTable('XPATH表达式' passing 所在表的XMLType列

          columns 列名  类型   path  XPATH表达式)

  1.功能  

  使用XMLTable可以方便的将XMLType字段转换为表格形式来进行下一步的操作

  此函数将传入的XMLType列用XPATH表达式过滤后,按照columns定义的列规则,将节点和字段对应起来构成表格

  2.使用方法:

  select t.id,x.* from loginkcn_maritime_manifest t,xmltable(
    '/Root/Body/ContainerInfo/ContainerNumber' passing t.xml
    columns container_number varchar2(30) path 'text()'
  ) x where t.id='0272AB47DEDD450FBD06CA07463F245A';

  3.注意:

  转换时要注意XML的格式要符合DTD标准

  配合XPATH表达式可以实现更加复杂的筛选逻辑,如按照属性值进行筛选