文件名称:七个pdf理解spark系列_4-shuffleDetails
文件大小:2.59MB
文件格式:PDF
更新时间:2020-07-22 05:23:20
运行机制
GitHub上某位大牛JerryLead对Spark的理解,大量图示,生动形象,总共7个pdf,看完对spark的原理,运行机制以及后续性能调优有很大的帮助,这是第四个pdf,描述了shuffle的细节,对比了MapReduce与spark的shuffle过程,详解了Shuffle write和shuffle read,以及一些典型transformation的shuffle read过程