基于隐马模型的中国人名自动识别研究

时间:2012-07-24 19:21:00
【文件属性】:

文件名称:基于隐马模型的中国人名自动识别研究

文件大小:87KB

文件格式:DOC

更新时间:2012-07-24 19:21:00

自动识别

中国人名的识别是中文未登录词识别的重点和难点,目前的解决方案自身存在一些本质的缺陷,实际效果还难以满足实际需求。本文提出了一种基于角色标注的中国人名自动识别方法。即:利用从语料库中自动抽取的角色信息,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的召回率,准确率也得到了实际提高。实验数据证明:该方法是行之有效、能够成功解决中国人名的自动识别问题。


网友评论