MMSeg 算法分词

时间:2018-07-01 04:46:06
【文件属性】:

文件名称:MMSeg 算法分词

文件大小:686KB

文件格式:JAR

更新时间:2018-07-01 04:46:06

mmseg4j

开源地址 https://github.com/chenlb/mmseg4j-core mmseg4j core 使用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex 加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j 已经实现了这两种分词算法。


网友评论