lucene+pdfbox+lius全文检索pdf文件

时间:2015-11-18 16:42:55
【文件属性】:

文件名称:lucene+pdfbox+lius全文检索pdf文件

文件大小:20.82MB

文件格式:RAR

更新时间:2015-11-18 16:42:55

全文检索

项目中需要用到根据pdf内容全文检索pdf文件,网上看了很多开源框架,最后用了lucene+pdfbox+lius完成,支持建立包含子目录索引,全文检索多级目录的功能。 附源码和jar包,希望能给大家提供帮助。


【文件预览】:
findpdf
----src()
--------PDFBoxPDFHandler.java(1KB)
--------SearchPDFFile.java(9KB)
----bin()
--------PDFBoxPDFHandler.class(2KB)
--------SearchPDFFile.class(9KB)
----.classpath(5KB)
----.settings()
--------org.eclipse.jdt.core.prefs(629B)
----.project(383B)
----lib()
--------jakarta-regexp-1.4.jar(28KB)
--------lucene-misc-3.3.0.jar(68KB)
--------lucene-remote-3.3.0.jar(14KB)
--------lucene-instantiated-3.3.0.jar(47KB)
--------FontBox-0.1.0-dev.jar(62KB)
--------lucene-queryparser-3.3.0.jar(267KB)
--------maven-ant-tasks-2.1.1.jar(1.25MB)
--------commons-beanutils-1.7.0.jar(184KB)
--------lucene-memory-3.3.0.jar(29KB)
--------lucene-spellchecker-3.3.0.jar(61KB)
--------lucene-icu-3.3.0.jar(64KB)
--------commons-logging-1.0.4.jar(37KB)
--------lucene-grouping-3.3.0.jar(41KB)
--------lucene-benchmark-3.3.0.jar(278KB)
--------lucene-wordnet-3.3.0.jar(39KB)
--------junit-4.7.jar(227KB)
--------ant-1.7.1.jar(1.26MB)
--------lucene-smartcn-3.3.0.jar(3.43MB)
--------commons-compress-1.1.jar(158KB)
--------lucene-test-framework-3.3.0.jar(114KB)
--------lucene-highlighter-3.3.0.jar(81KB)
--------Lius-1.0.jar(127KB)
--------xercesImpl-2.9.1-patched-XERCESJ-1257.jar(1.17MB)
--------lucene-spatial-3.3.0.jar(57KB)
--------lucene-stempel-3.3.0.jar(498KB)
--------icu4j-4_8.jar(6.94MB)
--------lucene-queries-3.3.0.jar(46KB)
--------lucene-core-3.3.0.jar(1.26MB)
--------commons-digester-1.7.jar(137KB)
--------lucene-xml-query-parser-3.3.0.jar(52KB)
--------ant-junit-1.7.1.jar(91KB)
--------commons-collections-3.1.jar(546KB)
--------lucene-demo-3.3.0.jar(15KB)
--------lucene-analyzers-3.3.0.jar(813KB)
--------PDFBox-0.7.3.jar(3.17MB)

网友评论

  • 比较老的版本的,还好用,支持
  • 没有说明,需要详细研究下。
  • 这个功能很好,能使用,赞一个。
  • 感谢分享,谢谢!
  • 求博主给出详细的使用说明,拿到不知怎么用啊
  • 可以用 ,但是lius的用法不具体 ,如果完善下就更好了
  • 完整例子,值得推荐.
  • 很有用,我们团队需要他
  • 要是有详细的说明就更好了。
  • 大文件如何处理
  • 可以使用,但是木有说明
  • 很好用,,谢谢
  • 很好用,解决了我的搜索问题
  • 可以使用~ 很好
  • 亲测,可以使用~ 很好
  • 很有用,对于用lucene搜索pdf文件可以借鉴。
  • 测试过代码,很好。
  • 很感谢,终于找到处理办法了
  • 要是文档内附一个操作说明就更好了