文件名称:ictclas4j开源分词系统
文件大小:2.59MB
文件格式:RAR
更新时间:2013-02-02 11:55:47
ictclas4j
java开源分词系统主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典中的词,调节分词的效果
【文件预览】:
ictclas4j
----Data()
--------coreDict2.dct(1.49MB)
--------BigramDict.dct(7.19MB)
--------tr.ctx(408B)
--------lexical.ctx(10KB)
--------ns.ctx(408B)
--------nr.ctx(1KB)
--------coreDict.dct(1.49MB)
--------ns.dct(53KB)
--------tr.dct(63KB)
--------nr.dct(111KB)
----bin()
--------org()
----src()
--------org()
----segtag.bat(61B)