文件名称:中讨论的-linux树莓派智能家居
文件大小:2.37MB
文件格式:PDF
更新时间:2024-07-12 14:31:33
大数据 spark
象操作。事实上,Spark中的所有内容都建立在RDD之上。正如我们将在第4章中讨论的 那样,DataFrame操作构建在RDD之上,并编译为这些较低级别的工具,以实现方便且极 其高效的分布式执行。有些东西可能会使用RDD,尤其是在您阅读或操作原始数据时, 但在大多数情况下,您应该坚持使用结构化API。RDD的级别低于DataFrame,因为它们 向最终用户显示物理执行特征(如分区)。 您可能使用RDD的一件事是并行化存储在内存中的原始数据