文件名称:又好又快的极速分词2.0
文件大小:11.69MB
文件格式:RAR
更新时间:2014-04-05 09:32:13
中文分词
极速分词免费Windows版 langiner@gmail.com 又快又好的中文分词引擎 中文分词是互联网应用不可缺少的基础技术之一,也是其他语音和语言产品必不可少的技术组件。 经过连续多届国际中文分词评测,由字构词的分词方法获得了压倒性优势,极速分词采用由字构词技术路线,同时优化了分词速度,使得极速分词引擎具备了分词速度快和分词精度高的双重优势。 免费版性能指标 分词速度:350-500万字每秒,该速度远远超过目前商用分词的速度 分词精度:免费版仅仅使用200万字语料训练分词知识库,分词精度在95%左右,测试表明在保持速度的同时,可以通过增加训练语料规模,将性能提高到97%以上 测试环境:Intel 3GHZ CPU & 2G 内存 当前免费版仅仅包含基本分词功能,后续将继续推出免费的词性标注、关键词识别、新词识别;同时支持用户词典,任何问题和建议,可通过如下方式与作者联系 Email: langiner@gmail.com Blog: http://langiner.blog.51cto.com
【文件预览】:
Faster-v2.0
----WS.exe(60KB)
----free.knowledgebase(23.84MB)
----产品使用说明.txt(878B)
----test(2KB)
----query.ws.out(153KB)
----query.txt(119KB)
----test.out(2KB)
----FasterSeg.bat(289B)