文件名称:extract:用于并行化内容提取和分析的跨平台命令行工具
文件大小:766KB
文件格式:ZIP
更新时间:2024-05-22 00:51:10
etl solr tika index ediscovery
提炼 一种用于跨平台的分布式内容提取的跨平台命令行工具。 建立在之上,并且是,和调查背后的工程必不可少的部分。 它支持Redis支持的队列以进行分布式,并行提取,并将写入Solr,纯文本文件或标准输出。 有关指导和说明,请参见 。 积分与合作 最初由的 Galizia开发。 我们欢迎您的贡献! 请提交请求或直接与我们联系。 执照 版权所有(c)2018国际调查记者协会。 请参阅LICENSE 。