文件名称:中文分词处理技术源代码
文件大小:496KB
文件格式:RAR
更新时间:2013-08-17 07:26:38
中文分词 分词技术 分词源代码 分词算法 分词处理器
专业提供中文分词扩展和中文词库。使中文分词,全文搜索不再是难点,一个函数即完成分词。然后即可把分词后的结果存储,再使用sphinx,Lucene等进行索引搜索了。
【文件预览】:
simplexu8.txt
segmenter.class
META-INF
----MANIFEST.MF(23B)
data
----tsurname_u8.txt(2KB)
----snumbers_u8.txt(246B)
----ssurname_u8.txt(2KB)
----sforeign_u8.txt(755B)
----tforeign_u8.txt(781B)
----tnumbers_u8.txt(245B)
----snotname_u8.txt(192B)
----tnotname_u8.txt(188B)
segmenter.java