ICTCLAS中文分词和关键字匹配

时间:2019-01-14 07:56:04
【文件属性】:

文件名称:ICTCLAS中文分词和关键字匹配

文件大小:10.26MB

文件格式:ZIP

更新时间:2019-01-14 07:56:04

分词与匹配

本程序使用ICTCLAS中文分词系统,支持中文分词,同时实现高效率的关键字匹配,使用的分词系统支持用户自定义词典,并支持GBK和UTF-8编码,在Linux系统上运行,同时避免某些因证书引起的问题,适用于个人研究,因商业使用带来的问题,本人不负责。 系统采用2中高效的算法进行多模式串的匹配。 测试与Ubuntu14.04系统。


【文件预览】:
newVersion
----allhead.h(112B)
----NLPIR.h(24KB)
----ACmachine.h(137B)
----hashs.cpp(2KB)
----cDemoOK.h(127B)
----main.cpp(853B)
----ACmachine.cpp(13KB)
----Makefile(528B)
----hashs.h(140B)
----libNLPIR.so(1.96MB)
----userdict.txt(95B)
----user_dic.txt(108B)
----backup()
--------user.lic(236B)
--------NLPIR.h(20KB)
--------libNLPIR.so(1.73MB)
----cDemoOK.cpp(4KB)
----Data()
--------GBKC.wordlist(163KB)
--------NLPIR_First.map(192B)
--------UserDict.pdat(33KB)
--------GBK2FTU8.map(279KB)
--------nr.role(1.68MB)
--------UTF2GBK.map(279KB)
--------FTU82GBK.map(279KB)
--------location.map(78KB)
--------FieldDict.pdat(256KB)
--------UTF8.pdat(544KB)
--------UTF8.wordlist(186KB)
--------20151223.log(320B)
--------FieldDict.pos(58B)
--------BIG5.pdat(457KB)
--------GBK.pdat(536KB)
--------PKU_First.map(200B)
--------GBKC.pdat(538KB)
--------GBK2BIG.map(279KB)
--------NLPIR.user(3KB)
--------BIG5.wordlist(155KB)
--------UserDefinedDict.lst(108B)
--------11111KeyBlackList.pdat(544KB)
--------GBK2UTF.map(279KB)
--------nr.ctx(2KB)
--------FTU8.pdat(534KB)
--------ICTPOS.map(322B)
--------charset.type(64KB)
--------20151224.log(2KB)
--------NLPIR.ctx(36KB)
--------location.pdat(407KB)
--------nr.fsa(3KB)
--------BIG2GBK.map(279KB)
--------CoreDict.pos(1.7MB)
--------location.wordlist(104KB)
--------GBKA.wordlist(163KB)
--------GBKC2GBK.map(279KB)
--------GranDict.pos(1.7MB)
--------sentiment.pdat(834KB)
--------Configure.xml(1KB)
--------GBKA2UTF.map(279KB)
--------NewWord.lst(5KB)
--------FTU8.wordlist(186KB)
--------BiWord.big(3.36MB)
--------GBK2GBKC.map(279KB)
--------GranDict.pdat(1.89MB)
--------GBK.wordlist(163KB)
--------PKU.map(223B)
--------GBKA.pdat(538KB)
--------UTF2GBKA.map(279KB)
--------CoreDict.pdat(1.62MB)
--------CoreDict.unig(467KB)
--------sentiment.ung(86KB)
--------English()

网友评论

  • 下载了我该怎么用
  • 没来得及细看,貌似不错
  • 为什么下不了啊?老师下到40%就下不了了