ictclas4j

时间:2011-07-31 07:58:21
【文件属性】:

文件名称:ictclas4j

文件大小:2.94MB

文件格式:ZIP

更新时间:2011-07-31 07:58:21

ictclas

ictclas中科院分词


【文件预览】:
Data
----coreDict2.dct(1.49MB)
----BigramDict.dct(7.19MB)
----tr.ctx(408B)
----lexical.ctx(10KB)
----ns.ctx(408B)
----nr.ctx(1KB)
----coreDict.dct(1.49MB)
----ns.dct(53KB)
----tr.dct(63KB)
----nr.dct(111KB)
bin
----org()
--------ictclas4j()
src
----org()
--------ictclas4j()
segtag.bat

网友评论

  • 挺好的,感觉很不错
  • 分词效果只能是按照单词来分,不能按词组来分,还有分词后的词性大部分都是nx,比较难提取
  • 很好,就是不能多线程
  • 可以用,很感激。解压以后把Data文件夹整个拷贝到 Eclipse项目的文件夹下, 而 bin目录下的 org文件夹整个拷贝到你 Eclipse项目的 bin目录下,把src目录下的org文件夹整个拷贝到 Eclipse项目 的src目录下,再添加一个Apache的commons的jar包就可以用了。