lucene分词测试代码

时间:2010-12-11 06:01:25
【文件属性】:

文件名称:lucene分词测试代码

文件大小:2.07MB

文件格式:RAR

更新时间:2010-12-11 06:01:25

java lucene 中文分词

用java写的图形分词测试的小东西,用的分词器是:
来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器,其使用“正向全切分算法”,42万汉字字符/每秒的处理能力(IBM ThinkPad 酷睿I 1.6G 1G内存 WinXP),对数量词、地名、路名的优化处理,对未知词汇采用自识别结合二元切分算法,确保搜索召回率。但是没有源代码下载,只能联系作者索要。


【文件预览】:
GUI1
----run.bat(35B)
----dist()
--------GUIFormExamples.jar(8KB)
--------README.TXT(1KB)
----manifest.mf(82B)
----src()
--------package1()
----build()
--------classes()
----lib()
--------je-analysis-1.4.0.jar(878KB)
--------IKAnalyzer2.0.2OBF.jar(852KB)
--------lucene-core-2.0.0.jar(394KB)
----build.xml(3KB)
----nbproject()
--------build-impl.xml(29KB)
--------private()
--------project.properties(2KB)
--------project.xml(641B)
--------genfiles.properties(455B)

网友评论

  • 代码写的有点乱,但我还是看明白了,照方抓药,学习了,谢谢。