文件名称:CRF与规则相结合的中文地名识别 (2012年)
文件大小:966KB
文件格式:PDF
更新时间:2024-05-29 23:32:17
自然科学 论文
采用递增式学习策略优化条件随机域(conditionalrandomfields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统。实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%。