文件名称:利用Impala+Kudu构建准实时分析应用
文件大小:4.16MB
文件格式:PDF
更新时间:2020-06-05 04:11:38
Impala, Kudu
Kudu是Cloudera开源的新型列式存储系统,Apache Hadoop生态圈的*项目之一,解决了传统Lamda架构处理Hadoop上快速变化数据的存储和处理技术过于复杂的问题,同时Kudu能够与Hadoop生态的其他组件比如Impala、Spark、Flume和Kafka等组件集成,大大降低了对快速变化的数据进行准实时分析的架构设计和实现的门槛。本演讲主要对Kudu的动机、背景,以及架构进行简单介绍,并通过实际的应用场景介绍Impala+Kudu的组合实现通过SQL技术对快速变化的数据实现准实时分析的能力