文件名称:Spark结构式流编程指南
文件大小:414KB
文件格式:PDF
更新时间:2024-02-17 08:29:01
Spark结构式流编程指南
本文来自于博客园,本文结合一个小样例,进行模型编程,创建数据框流和数据集流以及管理流式查询,希望对您的学习有所帮助。 StructuredStreaming是一个可拓展,容错的,基于SparkSQL执行引擎的流处理引擎。使用小量的静态数据模拟流处理。伴随流数据的到来,Spark SQL引擎会逐渐连续处理数据并且更新结果到最终的Table中。你可以在SparkSQL上引擎上使用DataSet/DataFrame