中文分词处理技术源代码

时间:2013-08-17 07:26:38
【文件属性】:

文件名称:中文分词处理技术源代码

文件大小:496KB

文件格式:RAR

更新时间:2013-08-17 07:26:38

中文分词 分词技术 分词源代码 分词算法 分词处理器

专业提供中文分词扩展和中文词库。使中文分词,全文搜索不再是难点,一个函数即完成分词。然后即可把分词后的结果存储,再使用sphinx,Lucene等进行索引搜索了。


【文件预览】:
simplexu8.txt
segmenter.class
META-INF
----MANIFEST.MF(23B)
data
----tsurname_u8.txt(2KB)
----snumbers_u8.txt(246B)
----ssurname_u8.txt(2KB)
----sforeign_u8.txt(755B)
----tforeign_u8.txt(781B)
----tnumbers_u8.txt(245B)
----snotname_u8.txt(192B)
----tnotname_u8.txt(188B)
segmenter.java

网友评论

  • 赞,非常好用!
  • 我记得当初下载的时候好多分词器都很坑,我是下载了N个,最后就一个能用,不知道是不是这个,给个折中的评价三分吧,毕竟当初下载的大部分不能用
  • 我也没用起来,没找到方法
  • 效果不好,不能用,还设8分
  • 不能用啊大哥。。。。。
  • 我的跑不出来啊
  • 不错,有深度
  • 跑不出来啊为什么
  • 没跑起来,太复杂了,有点晕
  • 用java写的,本来打算找c++的。。。。