ApacheFlink:特性、概念、组件栈、架构及原理分析

时间:2021-02-25 23:37:55
【文件属性】:
文件名称:ApacheFlink:特性、概念、组件栈、架构及原理分析
文件大小:728KB
文件格式:PDF
更新时间:2021-02-25 23:37:55
ApacheFlink:特性、概念、组件栈、架构及原理分析 ApacheFlink是一个面向分布式数据流处理和批量数据处理的开源计算平台,它能够基于同一个Flink运行时(FlinkRuntime),提供支持流处理和批处理两种类型应用的功能。现有的开源计算方案,会把流处理和批处理作为两种不同的应用类型,因为他们它们所提供的SLA是完全不相同的:流处理一般需要支持低延迟、Exactly-once保证,而批处理需要支持高吞吐、高效处理,所以在实现的时候通常是分别给出两套实现方法,或者通过一个独立的开源框架来实现其中每一种处理方案。例如,实现批处理的开源方案有MapReduce、Tez、Crunch、Spark,实现流处理的开源方案有Samza、Storm。

网友评论