文件名称:elastic-indexer:CENDARI 项目中 ElasticSearch 的索引器
文件大小:1.18MB
文件格式:ZIP
更新时间:2024-07-05 09:28:53
Java
用于 CENDARI 的 ElasticSearch 索引器 提供一个 Facade 对象fr.inria.aviz.elasticindexer.Indexer来执行几个操作: 使用(扩展)Tika 的结果来解析文件并返回文本内容和元数据。 结果将转换为 DocumentInfo 类型。 通过发送到elasticsearch来索引DocumentInfo中的数据 在elasticsearch中搜索文档 如果需要,在 elasticsearch 中创建映射(架构)。
【文件预览】:
elastic-indexer-master
----pom.xml(4KB)
----TODO(105B)
----LICENSE(2KB)
----src()
--------test()
--------main()
----.gitignore(321B)
----README.md(468B)
----scripts()
--------cendari_resources.py(979B)
--------data_api.py(998B)