文件名称:一种新的词语权重计算方法 (2011年)
文件大小:291KB
文件格式:PDF
更新时间:2024-06-06 14:24:18
自然科学 论文
词语权重计算是自然语言处理中的重要问题,是文档语义表示的重要实现手段。词语的权重主要由两部分决定,一部分是词语在文档中的重要性度量,另一部分是基于统计方法所得的词语在区分不同文档能力上的度量即词语全局权重。本文就针对有相对稳定性的词语全局权重计算方法分析比较了现有的几种词语全局权重计算方法,并在此基础上提出了一种新的组合词语全局权重计算方法,实验证明本文提出的新方法能够有效地提高了系统的性能。