论文研究-基于词序列频率有向网的中文组合词提取算法.pdf

时间:2022-08-11 16:02:34
【文件属性】:

文件名称:论文研究-基于词序列频率有向网的中文组合词提取算法.pdf

文件大小:236KB

文件格式:PDF

更新时间:2022-08-11 16:02:34

有向图,组合词,词序列,认知心理模式

随着人类知识体系的不断拓展和深化,很多组合词(多个词或语素组成的词)被创造出来用于表达新的概念。由于无法及时把组合词收录进词库,分词系统无法识别它们。为此,从文本中提取组合词成为智能计算领域的一个热门的研究方向。借鉴人类的认知心理模式,提出一种基于词序列频率有向网的组合词抽取算法,以识别*文本中的组合词。算法首先建立描述文本中的词序列出现频率的有向网,然后通过独特的矩阵运算,逐步把组合词提取出来。算法的优点是无须借助专业的语言知识,在实验分析中,算法显示了较好的效果。


网友评论