文件名称:mmseg4j分词器
文件大小:2.84MB
文件格式:ZIP
更新时间:2015-11-29 14:07:16
分词器
在com.chenlb.mmseg4j.analysis包里扩展lucene analyzer。 MMSegAnalyzer默认使用max-word方式分词(还有:ComplexAnalyzer, SimplexAnalyzer, MaxWordAnalyzer)。
【文件预览】:
README.txt
CHANGES.txt
data
----words.dic(1.53MB)
----units.dic(511B)
----chars.dic(93KB)
----words-my.dic(9B)
build.xml
mmseg4j-all-with-dic-1.9.0.v20120712-SNAPSHOT.jar
dist
----mmseg4j-analysis-1.9.0.v20120712-SNAPSHOT.jar(7KB)
----mmseg4j-all-with-dic-1.9.0.v20120712-SNAPSHOT.jar(689KB)
----mmseg4j-core-1.9.0.v20120712-SNAPSHOT.jar(84KB)
----mmseg4j-core-with-dic-1.9.0.v20120712-SNAPSHOT.jar(678KB)
----mmseg4j-solr-1.9.0.v20120712-SNAPSHOT.jar(5KB)
src
----com()
--------chenlb()
ivy.xml
mmseg4j-all-1.9.0.v20120712-SNAPSHOT.jar
build.properties
LICENSE.txt