文件名称:storey:实时数据+ ML管道
文件大小:3.7MB
文件格式:ZIP
更新时间:2024-04-14 14:11:29
Python
层 Storey是一个异步流媒体库,用于实时事件处理和功能提取。 在本文件中 :play_button: 有关更多信息,请参见。 API演练 Storey流包含由build_flow函数链接在一起的步骤,每个步骤都执行其指定的工作。 支持的步骤 输入步骤 Source AsyncSource ReadCSV ReadParquet DataframeSource 处理步骤 Filter Map FlatMap MapWithState Batch(max_events, timeout) -批量处理事件。 此步骤每隔max_events个事件发出一个批处理,或者从接收到批处理中的第一个事件起经过超时秒数后,将发出一个批处理。 Choice JoinWithV3IOTable SendToHttp AggregateByKey(aggregations,cache, key=None,