横瓜中文分词器

时间:2016-03-18 07:21:45
【文件属性】:

文件名称:横瓜中文分词器

文件大小:645KB

文件格式:RAR

更新时间:2016-03-18 07:21:45

中文 分词

横瓜中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。


【文件预览】:
gaop
----说明.txt(92B)
----下载银行-提供免费绿色软件下载.url(265B)
----高频词数量查询工具v1.0.exe(1.68MB)

网友评论