文件名称:九头蛇
文件大小:5.91MB
文件格式:ZIP
更新时间:2024-03-11 13:39:35
Java
九头蛇 Hydra是最初在开发的分布式数据处理和存储系统。 它提取数据流(认为是日志文件),并构建树,这些树是数据的汇总,摘要或转换。 人们可以使用这些树来进行探索(小查询),作为机器学习管道的一部分(大查询),或支持网站上的实时控制台(大量查询)。 您可以从命令行运行hydra来切片和切块您所坐着的Apache访问日志(或该庞大的csv文件)。 或者,如果每天喝几TB的钱,那就运行Hydra Cluster,它通过资源共享,作业管理,分布式备份,数据分区和高效的批量文件传输来支持您的工作。 文档和参考 包含概念,教程,指南和Web API。 是根据源代码自动构建的,并且包含有关hydra可配置作业组件的参考资料。 是一篇博客文章,其中包含有关水合处理的完整介绍。 是hydra尝试遵循的代码样式。 建筑 假设您已经安装并配置了 : mvn package 应该编译并构建jar。