lucene开发序之luke神器

时间:2020-12-21 03:37:41

lucene是一款很优秀的全文检索的开源库,目前最新的版本是lucene4.4,关于lucene的历史背景以及发展状况,在这里笔者就不多介绍了,如果你真心想学习lucene,想必在这之前你已经对此作过一些了解。

  有很多人知道lucene或者solr,但是却有很少人知道luke,在这里笔者就对luke做一个简单的介绍,Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改和调试。luke是google公司最早提供的,对于lucene的直接索引查看很方便,在这之前,如果你想查看下你生成的lucene的索引的全部内容,你得需要写很多代码进行操作,更有甚,也许你只想简简单单的看下生成索引的总数据量,你也得写一段代码才能统计出来,而luke的出现,就为lucene的查看及调试,提供了一个很好的界面操作工具,对lucene及solr生成的索引,可以非常方便的进行查询及调试,不仅如此luke还提供了良好的插件机制,使用者可以自定义某些功能进行安装使用,非常灵活。

  使用luke工具,不仅可以对索引进行直接查看,还可以对索引进行增加,删除,修改,以及优化,还可以是使用不同的分词器,对特定的字段进行分词测试,等等,这一点非常类似solr的管理页面提供的功能,但是二者的侧重点不在一个地方。

  luke工具的使用也非常简单,下载完luke后直接放在某个盘符下然后可以在cmd窗口找到luke工具所在的盘符根路径下,使用java -jar luke.jar就可以启动了,有的luke工具直接双击运行就可以启动,使用时候两种方式都可以试一下,启动之后,点击Browser按钮,找到你的索引路径点OK,即可显示你索引的内容,不过使用luke得注意版本问题,一般来说luke是向后兼容的,但是如果你是4.x的lucene索引,那么你使用3.x的luke工具查看,这样是不行的,反之确实可以的。

Luke安装及使用

1、首先配置好JAVA环境。

2、下载luke:http://www.getopt.org/luke/luke-0.9.2/lukeall-0.9.2.jar

3、双击lukeall-0.9.2.jar。

4、选择索引文件查看。

另外,Luke的plugin中带了一个Analyzer的测试工具。

在Luke中选择plugins标签,再选择Analyzer Tool,就可以使用这个测试Analyzer的工具了。在下拉列表中选择要测试的Analyzer,然后输入要分析的文本,点Analyze,就可以看到分析出来的token了。这个工具可以测试很多analyzer,除了最基本的WhitespaceAnalyzer、StopAnalyzer、SimpleAnalyzer、StandardAnalyzer之外还可以实验KeywordAnalyzer、SnowballAnalyzer、CJKAnalyzer、ChineseAnalyzer等等,可以说是包罗万象了。

写索引和搜索程序之前,都可以用这个工具来比较一下各种Analyzer的运行结果。另外估计如果把自己写的Analyzer编译后加入Luke的jar包的相应位置中,应该也可以测试自己的Analyzer类了。

下载地址:http://download.csdn.net/detail/irfen/7700397#comment

下载完后直接双击即可