文件名称:lucene+pdfbox+lius全文检索pdf文件
文件大小:20.82MB
文件格式:RAR
更新时间:2015-11-18 16:42:55
全文检索
项目中需要用到根据pdf内容全文检索pdf文件,网上看了很多开源框架,最后用了lucene+pdfbox+lius完成,支持建立包含子目录索引,全文检索多级目录的功能。 附源码和jar包,希望能给大家提供帮助。
【文件预览】:
findpdf
----src()
--------PDFBoxPDFHandler.java(1KB)
--------SearchPDFFile.java(9KB)
----bin()
--------PDFBoxPDFHandler.class(2KB)
--------SearchPDFFile.class(9KB)
----.classpath(5KB)
----.settings()
--------org.eclipse.jdt.core.prefs(629B)
----.project(383B)
----lib()
--------jakarta-regexp-1.4.jar(28KB)
--------lucene-misc-3.3.0.jar(68KB)
--------lucene-remote-3.3.0.jar(14KB)
--------lucene-instantiated-3.3.0.jar(47KB)
--------FontBox-0.1.0-dev.jar(62KB)
--------lucene-queryparser-3.3.0.jar(267KB)
--------maven-ant-tasks-2.1.1.jar(1.25MB)
--------commons-beanutils-1.7.0.jar(184KB)
--------lucene-memory-3.3.0.jar(29KB)
--------lucene-spellchecker-3.3.0.jar(61KB)
--------lucene-icu-3.3.0.jar(64KB)
--------commons-logging-1.0.4.jar(37KB)
--------lucene-grouping-3.3.0.jar(41KB)
--------lucene-benchmark-3.3.0.jar(278KB)
--------lucene-wordnet-3.3.0.jar(39KB)
--------junit-4.7.jar(227KB)
--------ant-1.7.1.jar(1.26MB)
--------lucene-smartcn-3.3.0.jar(3.43MB)
--------commons-compress-1.1.jar(158KB)
--------lucene-test-framework-3.3.0.jar(114KB)
--------lucene-highlighter-3.3.0.jar(81KB)
--------Lius-1.0.jar(127KB)
--------xercesImpl-2.9.1-patched-XERCESJ-1257.jar(1.17MB)
--------lucene-spatial-3.3.0.jar(57KB)
--------lucene-stempel-3.3.0.jar(498KB)
--------icu4j-4_8.jar(6.94MB)
--------lucene-queries-3.3.0.jar(46KB)
--------lucene-core-3.3.0.jar(1.26MB)
--------commons-digester-1.7.jar(137KB)
--------lucene-xml-query-parser-3.3.0.jar(52KB)
--------ant-junit-1.7.1.jar(91KB)
--------commons-collections-3.1.jar(546KB)
--------lucene-demo-3.3.0.jar(15KB)
--------lucene-analyzers-3.3.0.jar(813KB)
--------PDFBox-0.7.3.jar(3.17MB)