中科院分词java代码

时间:2015-05-04 04:02:29
【文件属性】:

文件名称:中科院分词java代码

文件大小:8.8MB

文件格式:RAR

更新时间:2015-05-04 04:02:29

java 分词

中科院分词算法为目前针对中文文本分词效果最佳的算法,为聚类算法提供了良好的数据源


【文件预览】:
API
----user.lic(236B)
----ICTCLAS()
--------I3S()
----ICTCLAS50.h(10KB)
----ICTCLAS50.dll(235KB)
----ICTCLAS50.lib(7KB)
----Configure.xml(1KB)
----ICTCLAS_I3S_AC_ICTCLAS50.h(2KB)
----Data()
--------ICTCLAS30.ctx(36KB)
--------nr.role(1.68MB)
--------FieldDict.pdat(256KB)
--------FieldDict.pos(72B)
--------PKU_First.map(288B)
--------nr.ctx(2KB)
--------ICTPOS.map(406B)
--------nr.fsa(3KB)
--------ICTCLAS_First.map(288B)
--------CoreDict.pos(1.7MB)
--------GranDict.pos(1.7MB)
--------BiWord.big(3.36MB)
--------GranDict.pdat(1.89MB)
--------PKU.map(307B)
--------CoreDict.pdat(1.62MB)
--------character.idx(512KB)
--------CoreDict.unig(467KB)
--------character.type(64KB)
Demo
----user.lic(236B)
----ICTCLAS50.dll(68KB)
----GOLAXY_DEMO.exe(60KB)
----ICTCLAS50.lib(4KB)
----Configure.xml(1KB)
----userdict.txt(26B)
----S2TLib.dll(56KB)
----Data()
--------ICTCLAS30.ctx(36KB)
--------nr.role(1.68MB)
--------FieldDict.pdat(256KB)
--------FieldDict.pos(72B)
--------PKU_First.map(288B)
--------nr.ctx(2KB)
--------ICTPOS.map(406B)
--------nr.fsa(3KB)
--------ICTCLAS_First.map(288B)
--------CoreDict.pos(1.7MB)
--------GranDict.pos(1.7MB)
--------BiWord.big(3.36MB)
--------GranDict.pdat(1.89MB)
--------PKU.map(307B)
--------CoreDict.pdat(1.62MB)
--------character.idx(512KB)
--------CoreDict.unig(467KB)
--------character.type(64KB)
Sample
----Windows_64_jni_Demo()
--------user.lic(236B)
--------TestMain.java(4KB)
--------ICTCLAS()
--------ICTCLAS50.h(10KB)
--------test.txt(619B)
--------ICTCLAS50.dll(235KB)
--------ICTCLAS50.lib(7KB)
--------Configure.xml(1KB)
--------TestMain.class(2KB)
--------userdict.txt(26B)
--------ICTCLAS_I3S_AC_ICTCLAS50.h(2KB)
--------readme.txt(470B)
--------Data()
Doc
----ICTPOS汉语词性标记集.doc(61KB)
----ICTCLAS5.0接口文档.doc(199KB)

网友评论

  • 不错,不过有些bug,看不到源代码
  • 不错,不过到处都有