中文分词与关键词提取(NLPIR java版)

时间:2016-05-14 09:14:05
【文件属性】:

文件名称:中文分词与关键词提取(NLPIR java版)

文件大小:3.8MB

文件格式:RAR

更新时间:2016-05-14 09:14:05

中文分词 关键词提取

NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;这个是java版本


【文件预览】:
Win-32bit-JNI-lib
----TestNLPIR.java(3KB)
----test_result2.TXT(1KB)
----.settings()
--------org.eclipse.core.resources.prefs(121B)
----test_result1.TXT(1KB)
----.project(393B)
----test.TXT(819B)
----.classpath(226B)
----NLPIR_JNI.dll(1.6MB)
----kevin()
--------zhang()
----TestNLPIR.class(2KB)
----Data()
--------GBKC.wordlist(163KB)
--------NLPIR_First.map(288B)
--------UserDict.pdat(6KB)
--------nr.role(1.68MB)
--------UTF2GBK.map(279KB)
--------FieldDict.pdat(256KB)
--------UTF8.pdat(544KB)
--------UTF8.wordlist(186KB)
--------FieldDict.pos(72B)
--------BIG5.pdat(457KB)
--------GBK.pdat(536KB)
--------PKU_First.map(288B)
--------GBKC.pdat(538KB)
--------GBK2BIG.map(279KB)
--------NLPIR.user(3KB)
--------BIG5.wordlist(155KB)
--------GBK2UTF.map(279KB)
--------nr.ctx(2KB)
--------ICTPOS.map(406B)
--------charset.type(64KB)
--------NLPIR.ctx(36KB)
--------nr.fsa(3KB)
--------BIG2GBK.map(279KB)
--------CoreDict.pos(1.7MB)
--------GBKA.wordlist(163KB)
--------GBKC2GBK.map(279KB)
--------GranDict.pos(1.7MB)
--------Configure.xml(856B)
--------GBKA2UTF.map(279KB)
--------NewWord.lst(126B)
--------BiWord.big(3.36MB)
--------GBK2GBKC.map(279KB)
--------GranDict.pdat(1.89MB)
--------GBK.wordlist(163KB)
--------PKU.map(307B)
--------GBKA.pdat(538KB)
--------UTF2GBKA.map(279KB)
--------CoreDict.pdat(1.62MB)
--------CoreDict.unig(467KB)

网友评论

  • 为什么我感觉没有实现
  • 有点麻烦,可以使用
  • 基本可以实现中文分词的效果,,具体的准确率还有待检验,,
  • 对,官网下载的是一样的。中文分词用,,不过分词还是有一定的瑕疵
  • 有点麻烦,可以使用
  • 官网下载包里和这个差不多!!
  • 正是我想要的效果 非常感谢
  • 初始化失败!
  • 初始化失败。不知道要jdk什么版本。
  • 初始化失败,自己再琢磨一下
  • 官网上的原工程,还不如到官网去下
  • 正是我想要的效果 非常感谢
  • 不错可以用~
  • 谢谢,非常感谢。对我的帮助还是很大的。
  • 不错!NLPIR是13年最新版本的分词工具 很不错!