大数据处理中的Lambda架构和Kappa架构

时间:2024-02-17 06:27:12
【文件属性】:

文件名称:大数据处理中的Lambda架构和Kappa架构

文件大小:208KB

文件格式:PDF

更新时间:2024-02-17 06:27:12

大数据处理中的Lambda架构和Kappa架构

首先我们来看一个典型的互联网大数据平台的架构,如下图所示:在这张架构图中,大数据平台里面向用户的在线业务处理组件用褐色标示出来,这部分是属于互联网在线应用的部分,其他蓝色的部分属于大数据相关组件,使用开源大数据产品或者自己开发相关大数据组件。你可以看到,大数据平台由上到下,可分为三个部分:数据采集、数据处理、数据输出与展示。将应用程序产生的数据和日志等同步到大数据系统中,由于数据源不同,这里的数据同步系统实际上是多个相关系统的组合。数据库同步通常用 Sqoop,日志同步可以选择Flume,打点采集的数据经过格式化转换后通过Kaf


网友评论