文件名称:ICTCLAS2013
文件大小:7.08MB
文件格式:ZIP
更新时间:2016-02-05 04:47:12
ICTCLAS 汉语 分词
简介: 应各位ICTCLAS用户的要求,张华平博士提前发布ICTCLAS2013 版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,内核升级10次,全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;
【文件预览】:
bin
----NLPIR.dll(1.6MB)
----NLPIR_WinDemo.exe(3.02MB)
Readme.txt
test
----十八大报告.TXT(57KB)
----test-utf8.TXT(10KB)
----test.TXT(6KB)
include
----NLPIR.h(20KB)
doc
----ICTPOS3.0.doc(61KB)
----NLPIR分词系统(ICTCLAS2013)接口文档20120911.doc(859KB)
----readme.txt(58B)
example-c
----Example-C.cpp(9KB)
lib
----NLPIR.lib(13KB)
Data
----GBKC.wordlist(163KB)
----NLPIR_First.map(288B)
----UserDict.pdat(1KB)
----nr.role(1.68MB)
----UTF2GBK.map(279KB)
----FieldDict.pdat(256KB)
----UTF8.pdat(544KB)
----UTF8.wordlist(186KB)
----FieldDict.pos(72B)
----BIG5.pdat(457KB)
----GBK.pdat(536KB)
----PKU_First.map(288B)
----GBKC.pdat(538KB)
----GBK2BIG.map(279KB)
----NLPIR.user(3KB)
----BIG5.wordlist(155KB)
----GBK2UTF.map(279KB)
----nr.ctx(2KB)
----ICTPOS.map(406B)
----charset.type(64KB)
----NLPIR.ctx(36KB)
----nr.fsa(3KB)
----BIG2GBK.map(279KB)
----CoreDict.pos(1.7MB)
----GBKA.wordlist(163KB)
----GBKC2GBK.map(279KB)
----GranDict.pos(1.7MB)
----Configure.xml(856B)
----GBKA2UTF.map(279KB)
----NewWord.lst(126B)
----BiWord.big(3.36MB)
----GBK2GBKC.map(279KB)
----GranDict.pdat(1.89MB)
----GBK.wordlist(163KB)
----PKU.map(307B)
----GBKA.pdat(538KB)
----UTF2GBKA.map(279KB)
----CoreDict.pdat(1.62MB)
----CoreDict.unig(467KB)