文件名称:论文研究-一种对英文字符串进行分词的方法.pdf
文件大小:115KB
文件格式:PDF
更新时间:2022-08-11 16:57:45
字典匹配,英文分词,后缀词
对AhoCorasick算法略作改变,用一个收词丰富的有优先级的字典构造AhoCorasick树,并利用它对英文字符串进行字典匹配。对匹配的结果,利用后缀词按优先级排序的特点设计了一个高效的分词算法。实验证明该算法具有高效性。
文件名称:论文研究-一种对英文字符串进行分词的方法.pdf
文件大小:115KB
文件格式:PDF
更新时间:2022-08-11 16:57:45
字典匹配,英文分词,后缀词
对AhoCorasick算法略作改变,用一个收词丰富的有优先级的字典构造AhoCorasick树,并利用它对英文字符串进行字典匹配。对匹配的结果,利用后缀词按优先级排序的特点设计了一个高效的分词算法。实验证明该算法具有高效性。