ACWPS(爱博汉语分词系统)分词组件 asp分词组件

时间:2013-03-20 03:22:42
【文件属性】:

文件名称:ACWPS(爱博汉语分词系统)分词组件 asp分词组件

文件大小:2.87MB

文件格式:RAR

更新时间:2013-03-20 03:22:42

分词组件 asp分词组件 分词com接口 爱博汉语分词系统

爱博汉语分词系统Web服务器支持标准的HTTP协议,可以跨平台调用,支持分布式运算; 爱博汉语分词系统COM组件提供COM和DLL接口(Windows环境) 以及共享库.so(Linux)形式,可支持所有支持COM接口调用的编程语言及脚本语言。 如:PHP、JSP、ASP、ASP.net、C/C++ 、VC6.0 、VC.net、BC、C#、VB6.0 、VB.net、Delphi、Java等。 爱博汉语分词系统支持自定义词语的功能,用户可根据自己需要定义添加汉语词组。 可根据需要自行定义影响检索结果的不必要的特殊字符,如:“%,*,&,的,啊,http,www”等。 爱博汉语分词系统同时具有英文单词的分词识别功能。 爱博汉语分词系统具有强大的词性标注的词性查询功能。可以将一句话中每个词语在这句话中的意思标注出来;可以通过词语查询接口,查询一个词语的所有可能出现的词性 软件系统采用ANSI标准C++开发,可广泛应用于Linux和Win32等操作系统平台。 爱博汉语分词系统采用高效特殊的算法引擎结构,每秒钟拆分可达数万字中文文本(具体根据计算机性能而定。),在对搜索关键词进行拆分情况下,其响应时问均在数毫秒之内,为搜索提供强劲动力。 采用特殊的词组拆分识别算法,可有效消除汉语词组中汉语歧义,并可识别各个行业内的特殊用语、专用词汇、公司名、地名等,并具有汉语成语、汉语短语识别功能。 ACWPS含盖了IT、化工、金融、贸易、纺织、电子、制造、冶金等各行各业以及日常生活用语中的汉语词组。 可自行定义干扰字、无意义字、敏感词过滤列表。如:啊、唉、个、了等无意义的以及煸动、反动、黄色和侵害他人的汉字、词组及英文。 本人已经测试可用。 注意两点: 1、没有注册的版本只支持25个字以内的分词。 2、必须安装在C盘默认的路径下才能使用


【文件预览】:
使用说明.txt
COM_API.htm
Data
----NormalChatDict.dct(788B)
----BigramDict.dct(7.19MB)
----newDict.dct(0B)
----StateSearchDict.dct(104B)
----LeaveWordDict.dct(178B)
----NotifyDict.dct(184B)
----tr.ctx(408B)
----lexical.ctx(10KB)
----test.dct(1.46MB)
----ns.ctx(408B)
----nr.ctx(1KB)
----coreDict.dct(1.46MB)
----PeopleNameDict.dct(321B)
----ns.dct(53KB)
----tr.dct(63KB)
----nr.dct(111KB)
personal_dict.ini
WebServer.dll
COM组件使用说明.htm
ACWPSServer.ini
ACWPSServer.htm
ACWPSServer.exe
UNWISE.EXE
ACWPSCOM.dll
ACWPS.dll
ACWPSCOM.asp
INSTALL.LOG
error.log
COM_Setup.reg
ACWPSServer_20100223.log
注册COM组件说明.txt

网友评论

  • 词库不能自定义,用的次数多了以后会报错
  • 分词效果不理想,不过可供学习研究
  • 测试通过。词库不能自定义
  • 词库不能自定义 唯一的遗憾
  • 可以用。但加载不了自定义词库,用的次数多了以后会报错
  • 真好,一直在找这东西,不过有点小问题,就是加载不了自定义词库