基于角色标注的中国人名自动识别研究

时间:2014-05-08 04:12:01
【文件属性】:
文件名称:基于角色标注的中国人名自动识别研究
文件大小:429KB
文件格式:PDF
更新时间:2014-05-08 04:12:01
研究,识别,中国,角色   该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用 ,采取 Viterbi 算法对切词结果进行角色标注 ,在角色序列的基础上 ,进行模式最大匹配 ,最终实现中国人名的识别.识别 过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完 全可以从真实语料库中自动抽取得到.通过对 16M字节真实语料库的封闭与开放测试 ,该方法取得了接近 98 %的 召回率.文中介绍了计算所汉语词法分析系统 ICTCLAS ,集成人名识别算法之后 ,词法分析的准确率提高了 1. 41 % ,同时人名识别的综合指标 F21 值达到了 95. 40 %.不同实验从各个角度表明:基于角色标注的人名识别算法 行之有效.

网友评论

  • 理解ICTCLAS必读文章 可参考http://blog.csdn.net/DanceFire/archive/2007/05/13/1606603.aspx帮助共同理解ICTCLAS开源代码的人名识别部分