文件名称:spark RDD操作详解
文件大小:695KB
文件格式:PDF
更新时间:2021-10-15 11:54:23
spark
RDD即弹性分布式数据集,有容错机制并可以被并行操作的元素集合,具有只读、分区、容错、高效、无需物化、可以缓存、RDD依赖等特征。RDD只是数据集的抽象,分区内部并不会存储具体的数据。
文件名称:spark RDD操作详解
文件大小:695KB
文件格式:PDF
更新时间:2021-10-15 11:54:23
spark
RDD即弹性分布式数据集,有容错机制并可以被并行操作的元素集合,具有只读、分区、容错、高效、无需物化、可以缓存、RDD依赖等特征。RDD只是数据集的抽象,分区内部并不会存储具体的数据。