lucene-pdf:一个能够轻松对 PDF 文本和元数据进行 Lucene 索引的库

时间:2024-07-30 20:42:40
【文件属性】:

文件名称:lucene-pdf:一个能够轻松对 PDF 文本和元数据进行 Lucene 索引的库

文件大小:161KB

文件格式:ZIP

更新时间:2024-07-30 20:42:40

Java

lucene-pdf lucene-pdf 是一个 JVM(Java、Scala、Groovy、Clojure 等)库,通过与集成,可以轻松地对 PDF 文本和元数据进行 Lucene 索引。 “安装” lucene-pdf 在 Maven 中心可用; 将它添加到您的 Maven 项目的pom.xml : < dependency> < groupId>com.snowtide < artifactId>lucene-pdf < version>3.0.0 或者,将上述 Maven 工件坐标添加到您的 {Gradle、Leiningen、sbt 等} 项目文件中。 lucene-pdf 适用于 JDK 1.5+,并针对 Lucene 核心的每个主要修订


【文件预览】:
lucene-pdf-master
----src()
--------lucene-2()
--------lucene-1()
--------lucene-4()
--------java()
--------lucene-3()
----.travis.yml(103B)
----LICENSE(1KB)
----test()
--------key_steps.pdf(142KB)
--------test_lucene_integration.clj(4KB)
--------test_documents.clj(3KB)
--------DocumentSerialization.pdf(16KB)
----README.md(4KB)
----project.clj(3KB)
----.gitignore(144B)

网友评论