实时计算Samza中文教程.pdf

时间:2022-11-29 12:24:06
【文件属性】:

文件名称:实时计算Samza中文教程.pdf

文件大小:654KB

文件格式:PDF

更新时间:2022-11-29 12:24:06

大数据 流计算 Samza kafka 中文教程

Samza是一款优秀的分布式流处理框架,非常像Twitter的流处理系统Storm(即Lambda架构Hadoop+Storm)。不同的是Samza基于Hadoop,而且使用了LinkedIn自家的Kafka分布式消息系统(即Kappa架构Kafka+Samza)。其优势在于:相对于Storm大部分是用Clojure实现的而言,Samza底层的实现语言是Scala和Java,而且代码不到万行,堪称小而美,从而可以更加低成本地去了解其实现,并作扩展和优化。因此,Samza成为越来越流行的流处理首选框架。本教程高屋建瓴,深入浅出,全面地介绍了Samza的基本概念和框架结构,系统地剖析了Samza的运行机理,并从其数据流处理逻辑的角度详解了其主要的API。本教程适合初学者快速入门,能让你在迅速掌握Samza的同时深刻理解流计算系统。


网友评论