文件名称:基于类向量模型的中文姓名识别研究
文件大小:187KB
文件格式:PDF
更新时间:2017-09-22 12:47:57
向量 姓名
汉语自动词法分析是文本分类、信息检索、对话问答、机器 翻译等中文信息处理任务的基础。由于汉语的词与词之问没 有明确的分割符,汉语词法分析首先面临着自动分词的问题, 而专名(人名、地名、机构名、时间表达、数字表达等)识别则是 汉语自动分词的难点之一。专名能否正确识别直接影响分词 的效果。中文姓名识别是专名识别的一个领域,姓名在专名中 占有很大比例。统计显示:中文姓名占专名的15%⋯ 。可见, 中文姓名的自动识别对于汉语专名识别以及自动分词具有重 要意义。