文件名称:Druid 一个实时分析数据仓库
文件大小:1.52MB
文件格式:PDF
更新时间:2018-09-26 16:01:02
Druid
Druid 是一个为大型(设计为 PB 级别)数据集上实时探索查询而设计的开源数 据分析和存储系统,提供极具成本效益并且永远在线(24x7x365x10)的实时数据摄 取和任意数据处理,并且在面对代码部署、机器故障以及其他意外情况时能保证 系统集群正常运行。 Druid 自发布以来,Github 上代码的活跃度一直很高,已经有很多组织和个 人参与到该项目的开发中来。因此 Druid 在过去的一年多时间里一直保持着很高 的版本发布频次。截至本文译本完成时, Druid 已经释放出 0.8.0 的稳定版本,该 版本在集群的稳定性和查询性能上已经有了相当的提升,同时也提供了“简单的” 界面支持。 本文是 Druid 官方提供的论文(WhitePaper)的中文译版,主要介绍 Druid 的核 心概念和架构设计原理。 由于目前 Druid 相关的文字资料相当稀少,除了其官方提供的一些指导文档, 本文也是最珍贵的文字资料之一。