文件名称:发现并协调数据集成的价值冲突-研究论文
文件大小:163KB
文件格式:PDF
更新时间:2024-06-29 13:49:41
Value Conflicts Data
来自自主和异构源的数据的集成需要预先识别和解决可能存在的语义冲突。 不幸的是,这需要系统集成商以艰苦的方式筛选来自不同系统的数据。 在本文中,我们建议通过提出一种方法和技术来发现潜在的语义冲突以及解决冲突所需的底层数据转换,可以(至少)部分自动化该过程。 我们的方法首先将数据值冲突分为两类:上下文无关和上下文相关。 虽然上下文无关冲突通常是由意外错误引起的,但上下文相关冲突主要是底层数据源异构的结果。 为了便于数据集成,提出了数据值转换规则来描述涉及上下文相关冲突的数据值之间的定量关系。 提出了一种从数据中发现数据值转换规则的通用方法。 该方法包括五个主要步骤:相关属性分析、候选模型选择、转换函数生成、转换函数选择和转换规则形成。 它正在原型系统 DIRECT 中实现,用于使用基于统计的技术的业务数据。 初步研究表明,所提出的方法是有前途的。