基于遗传神经网络的相似重复记录检测方法研究

时间:2015-06-29 04:52:12
【文件属性】:

文件名称:基于遗传神经网络的相似重复记录检测方法研究

文件大小:328KB

文件格式:CAJ

更新时间:2015-06-29 04:52:12

遗传神经网络

为了有效解决数据清洗领域中相似重复记录的检测问题,提出了一种基于遗传神经网络的相似重复记录检测方法。 该方法计算两条记录对应字段间的相似度,构建基于神经网络的检测模型,利用遗传算法对网络模型的权值进行优化,使用遗传神经网络组合多个字段上的相似度来检测相似重复记录。在不同领域数据集上的测试结果表明,该方法能够提高相似重复记录检测的准确率和检测精度。


网友评论