ictclas4j开源分词系统

时间:2013-02-02 11:55:47
【文件属性】:

文件名称:ictclas4j开源分词系统

文件大小:2.59MB

文件格式:RAR

更新时间:2013-02-02 11:55:47

ictclas4j

java开源分词系统主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典中的词,调节分词的效果


【文件预览】:
ictclas4j
----Data()
--------coreDict2.dct(1.49MB)
--------BigramDict.dct(7.19MB)
--------tr.ctx(408B)
--------lexical.ctx(10KB)
--------ns.ctx(408B)
--------nr.ctx(1KB)
--------coreDict.dct(1.49MB)
--------ns.dct(53KB)
--------tr.dct(63KB)
--------nr.dct(111KB)
----bin()
--------org()
----src()
--------org()
----segtag.bat(61B)

网友评论

  • 确实很牛比,但是分词速度太慢了