利用词汇分布相似度的中文词汇语义倾向性计算 (2009年)

时间:2024-05-31 03:38:43
【文件属性】:

文件名称:利用词汇分布相似度的中文词汇语义倾向性计算 (2009年)

文件大小:261KB

文件格式:PDF

更新时间:2024-05-31 03:38:43

工程技术 论文

针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义


网友评论