文件名称:极速分词免费Windows版
文件大小:12.72MB
文件格式:RAR
更新时间:2013-09-27 09:20:17
中文分词 由字构词 条件随机场 搜索引擎
极速分词:又快又好的中文分词引擎 中文分词是互联网应用不可缺少的基础技术之一,也是其他语音和语言产品必不可少的技术组件。 经过连续多届国际中文分词评测,由字构词的分词方法获得了压倒性优势,极速分词采用由字构词技术路线,同时优化了分词速度,使得极速分词引擎具备了分词速度快和分词精度高的双重优势。 免费版性能指标 分词速度:350万字每秒,该速度远远超过目前利用模型(如马尔科夫模型)进行分词的速度 分词精度:免费版仅仅使用200万字语料训练分词知识库,分词精度在95%左右,测试表明在保持速度的同时,可以通过增加训练语料规模,将性能提高到97%以上 测试环境:Intel 3GHZ CPU & 2G 内存 当前免费版仅仅包含基本分词功能,后续将继续推出免费的词性标注、关键词识别、新词识别;同时支持用户词典,任何问题和建议,可通过如下方式与作者联系 Email: langiner@gmail.com Blog: http://langiner.blog.51cto.com 更多信息参考官方下载: https://sourceforge.net/projects/crfdecoder/files/Faster-v1.0.rar/download 或者搜索 极速分词
【文件预览】:
Faster-v1.0
----WS.exe(60KB)
----FasterSeg.bat(289B)
----产品使用说明.txt(1KB)
----test(12KB)
----sample()
--------Windows_Demo_32_C++forDLL()
--------Readme.txt(80B)
----free.knowledgebase(20.61MB)
----api()
--------WSEngineer.h(1KB)
--------WS.lib(2KB)
--------WS.dll(52KB)
--------WSEngineer.cpp(3KB)
--------readme.txt(55B)
----test.out(15KB)