七个pdf理解spark系列_4-shuffleDetails

时间:2020-07-22 05:23:20
【文件属性】:

文件名称:七个pdf理解spark系列_4-shuffleDetails

文件大小:2.59MB

文件格式:PDF

更新时间:2020-07-22 05:23:20

运行机制

GitHub上某位大牛JerryLead对Spark的理解,大量图示,生动形象,总共7个pdf,看完对spark的原理,运行机制以及后续性能调优有很大的帮助,这是第四个pdf,描述了shuffle的细节,对比了MapReduce与spark的shuffle过程,详解了Shuffle write和shuffle read,以及一些典型transformation的shuffle read过程


网友评论

  • 写的非常详细 非常感谢