文件名称:分词器NLPIR
文件大小:4.63MB
文件格式:RAR
更新时间:2017-02-10 04:44:13
分词 NLPIR
目前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。国内国际排名均为第一。 项目已经配置好环境,导入Eclipse即可使用,文件内src下的TestUTF8.java可以直接运行,提供了分词接口
【文件预览】:
Nlpir
----bin()
--------WordSeperation.class(2KB)
--------TestUTF8.class(2KB)
--------kevin()
----NLPIR.dll(1.61MB)
----test()
--------十八大报告.TXT(57KB)
--------test-utf8_result.TXT(18KB)
--------testOut(9KB)
--------test-utf8.TXT(10KB)
--------test.TXT(6KB)
----.settings()
--------org.eclipse.core.resources.prefs(86B)
--------org.eclipse.jdt.core.prefs(629B)
----src()
--------WordSeperation.java(1KB)
--------TestUTF8.java(1KB)
--------kevin()
----.project(381B)
----file()
--------Data()
----.classpath(302B)
----NLPIR_JNI.dll(2.19MB)