文件名称:论文研究-基于群集智能的CRF与规则结合的中文地址抽取.pdf
文件大小:1.52MB
文件格式:PDF
更新时间:2022-08-11 13:33:57
条件随机场,地址抽取,规则抽取方法,群集智能,ACG算法,组合
地址抽取是信息采集研究的热点,但是如何保证高准确率与召回率一直是一个具有挑战性的问题。将基于CRF的方法与规则抽取方法相结合来进行地址抽取,并将优化后的结果再用来进行CRF训练;此过程不断循环迭代,直至性能不再提升,最后得到多个CRF分类器。这个不断迭代的过程就是基于群集智能的ACG算法流程,最后再通过组合多个分类器的结果形成最终结果。实验表明,该方法可以把召回率和准确率分别提高到96.44%和97.73%。