ETL若干关键技术研究

时间:2014-09-19 13:15:30
【文件属性】:
文件名称:ETL若干关键技术研究
文件大小:6.49MB
文件格式:NH
更新时间:2014-09-19 13:15:30
ETL 博士论文 摘要: 本文工作的主要贡献和研究内容如下: 1.给出了一个用于描述ETL过程的模型,称为ETL过程树,将异构数据转换、数据清理与查询树结合。E几过程树中数据清理规定只作用于单个关系节点,当修改ETL过程树中的数据清理规则时,不会对ETL过程树本身产生影响,降低了ETL过程的维护代价。 2.给出了差运算物化视图的增量维护的方法,给出了SRA和BRA两种增量维护方法,并讨论了增量的大小对这两种方法执行效率的影响。 3.在前两点的研究基础上,给出了根据描述全量ETL过程的ETL过程树自动产生增量ETL过程的算法,从而降低ETL过程的设计总代价。 4.利用己有数据血统查询的方法,同时考虑增量ETL过程中错误数据只出现于插入增量中的特性,给出了在增量ETL过程上进行错误数据逆向查询的算法,提高了逆向数据清理的效率。

网友评论

  • 虽然有一部分以我的水平看起来有一些困难,但是仍然是很好的资料,