文件名称:横瓜中文分词器
文件大小:645KB
文件格式:RAR
更新时间:2016-03-18 07:21:45
中文 分词
横瓜中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。
【文件预览】:
gaop
----说明.txt(92B)
----下载银行-提供免费绿色软件下载.url(265B)
----高频词数量查询工具v1.0.exe(1.68MB)