文件名称:中文分词与关键词提取(NLPIR java版)
文件大小:3.8MB
文件格式:RAR
更新时间:2016-05-14 09:14:05
中文分词 关键词提取
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;这个是java版本
【文件预览】:
Win-32bit-JNI-lib
----TestNLPIR.java(3KB)
----test_result2.TXT(1KB)
----.settings()
--------org.eclipse.core.resources.prefs(121B)
----test_result1.TXT(1KB)
----.project(393B)
----test.TXT(819B)
----.classpath(226B)
----NLPIR_JNI.dll(1.6MB)
----kevin()
--------zhang()
----TestNLPIR.class(2KB)
----Data()
--------GBKC.wordlist(163KB)
--------NLPIR_First.map(288B)
--------UserDict.pdat(6KB)
--------nr.role(1.68MB)
--------UTF2GBK.map(279KB)
--------FieldDict.pdat(256KB)
--------UTF8.pdat(544KB)
--------UTF8.wordlist(186KB)
--------FieldDict.pos(72B)
--------BIG5.pdat(457KB)
--------GBK.pdat(536KB)
--------PKU_First.map(288B)
--------GBKC.pdat(538KB)
--------GBK2BIG.map(279KB)
--------NLPIR.user(3KB)
--------BIG5.wordlist(155KB)
--------GBK2UTF.map(279KB)
--------nr.ctx(2KB)
--------ICTPOS.map(406B)
--------charset.type(64KB)
--------NLPIR.ctx(36KB)
--------nr.fsa(3KB)
--------BIG2GBK.map(279KB)
--------CoreDict.pos(1.7MB)
--------GBKA.wordlist(163KB)
--------GBKC2GBK.map(279KB)
--------GranDict.pos(1.7MB)
--------Configure.xml(856B)
--------GBKA2UTF.map(279KB)
--------NewWord.lst(126B)
--------BiWord.big(3.36MB)
--------GBK2GBKC.map(279KB)
--------GranDict.pdat(1.89MB)
--------GBK.wordlist(163KB)
--------PKU.map(307B)
--------GBKA.pdat(538KB)
--------UTF2GBKA.map(279KB)
--------CoreDict.pdat(1.62MB)
--------CoreDict.unig(467KB)