统计方法来识别中文姓名

时间:2012-04-19 14:33:59
【文件属性】:

文件名称:统计方法来识别中文姓名

文件大小:99KB

文件格式:PDF

更新时间:2012-04-19 14:33:59

统计方法来识别中文姓名

用统计方法来识别中文姓名。该方法将中文姓名的识别过程分为姓名候选和姓名确认两个阶段。采用隐马尔 可夫模型( H MM) 分类器从未经切分的汉字串中候选姓名。 利用人名与上下文词汇的互信息对候选人名进行最后的确认。 该方法是完全数据驱动的, 不需要姓名识别模板和规则。试验结果表明, 该方法的召回率为 8 2 . 7 %, 准确率为 8 9 . 6 %。


网友评论