论文研究-基于Web的重复属性自动识别方法.pdf下载

【文件属性】：

文件名称：论文研究-基于Web的重复属性自动识别方法.pdf

文件大小：511KB

文件格式：PDF

更新时间：2022-10-01 05:19:02

论文研究

在建立数据仓库的过程中，需要从多个数据源导入数据。这些数据存在大量相似重复记录，严重影响了数据利用率和决策质量。因此，相似重复记录的检测已经成为数据仓库等领域的热点研究问题，而重复属性的识别是完成相似重复记录检测的关键。提出一种高效的基于Web的重复属性自动识别算法，该算法使用搜索引擎返回的摘要和URL信息计算属性相似度，并使用查询探针提高查询准确度。实验结果表明该算法有较高的查全率。

立即下载

秒客网

论文研究-基于Web的重复属性自动识别方法.pdf

网友评论

相关文章