mmseg4j分词器

时间:2015-11-29 14:07:16
【文件属性】:

文件名称:mmseg4j分词器

文件大小:2.84MB

文件格式:ZIP

更新时间:2015-11-29 14:07:16

分词器

在com.chenlb.mmseg4j.analysis包里扩展lucene analyzer。 MMSegAnalyzer默认使用max-word方式分词(还有:ComplexAnalyzer, SimplexAnalyzer, MaxWordAnalyzer)。


【文件预览】:
README.txt
CHANGES.txt
data
----words.dic(1.53MB)
----units.dic(511B)
----chars.dic(93KB)
----words-my.dic(9B)
build.xml
mmseg4j-all-with-dic-1.9.0.v20120712-SNAPSHOT.jar
dist
----mmseg4j-analysis-1.9.0.v20120712-SNAPSHOT.jar(7KB)
----mmseg4j-all-with-dic-1.9.0.v20120712-SNAPSHOT.jar(689KB)
----mmseg4j-core-1.9.0.v20120712-SNAPSHOT.jar(84KB)
----mmseg4j-core-with-dic-1.9.0.v20120712-SNAPSHOT.jar(678KB)
----mmseg4j-solr-1.9.0.v20120712-SNAPSHOT.jar(5KB)
src
----com()
--------chenlb()
ivy.xml
mmseg4j-all-1.9.0.v20120712-SNAPSHOT.jar
build.properties
LICENSE.txt

网友评论

  • 好东西!一直在找。没想到在这里找到了。还有源代码,赞一个!
  • 没有ik好用,还是谢谢分享啊
  • 还可以吧……感觉没ik好用
  • 给力啊,还行。。