文件名称:S4:分布式流计算平台
文件大小:918KB
文件格式:PDF
更新时间:2014-11-09 14:44:55
S4 分布式 流计算
S4 是一个通用的,分布式的,可扩展的,分区容错的,可插拔的平台。开 发者可以很容易的在其上开发面向*不间断流数据处理的应用。编键的数据 事件被分类路由到处理单元(Processing Elements,PEs),处理单元消费这些事 件,做如下事情之一或全部:(1)发出一个或多个可能被其他 PE 处理的事件。 (2)发布结果。这种架构类似提供了封装和地址透明语义的 Actor 模式,因此 允许应用在大规模并发的同时暴露简单的编程接口给应用开发者。在这篇论文 里,我们将勾画 S4 的架构细节,描述各种各样的应用,包括实际中的部署。我 们的设计主要由大规模应用在生产环境中的数据采集和机器学习所驱动。我们 展示了 S4 设计令人惊奇的灵活性,使其运行在构筑于普通硬件之上的大规模集群中。 PDF 版本,方便大家阅读。