文件名称:flint:适用于Apache Spark的时间序列库
文件大小:887KB
文件格式:ZIP
更新时间:2024-05-02 06:29:35
spark timeseries Scala
Flint:Apache Spark的时间序列库 大规模分析时间序列数据的能力对于基于Spark的金融和物联网应用的成功至关重要。 Flint是Two Sigma在Spark中高度优化的时间序列操作的实现。 它利用时间序列数据的自然顺序来对时间序列数据执行真正的并行和丰富的分析,以提供基于位置的优化。 Flint是一个用于Spark的开源库,它基于TimeSeriesRDD ,时间序列感知的数据结构以及使用TimeSeriesRDD的时间序列实用程序和分析函数的集合。 与DataFrame和Dataset不同,Flint的TimeSeriesRDD可以利用DataFrame Dataset的现有排序属性,并且几乎所有对这些数据集的数据操作和分析都尊重其时间排序属性。 它与Spark的其他时间序列工作不同之处在于,它可以有效地跨面板数据或大规模高频数据进行计算。 要求 相依性 版本 Spa