论文研究-一种对英文字符串进行分词的方法.pdf

时间:2022-08-11 16:57:45
【文件属性】:

文件名称:论文研究-一种对英文字符串进行分词的方法.pdf

文件大小:115KB

文件格式:PDF

更新时间:2022-08-11 16:57:45

字典匹配,英文分词,后缀词

对AhoCorasick算法略作改变,用一个收词丰富的有优先级的字典构造AhoCorasick树,并利用它对英文字符串进行字典匹配。对匹配的结果,利用后缀词按优先级排序的特点设计了一个高效的分词算法。实验证明该算法具有高效性。


网友评论