spark学习记录-2

时间:2022-01-26 02:21:20

spark编程模型

======

spark如何工作的?

1、user应用产生RDD,操作变形,运行action操作

2、操作的结果在有向无环图DAG中

3、DAG被编译到stages阶段中

4、每一阶段作为任务的一部分被执行(一个task对应一个partition分块)

========

narrow transformation和wide transformation

1, narrow transformation,

map()   filter()

2,wide transformation

groupByKey()

reduceByKey()

=============