Spark内核机制解析及性能调优教程(含资料)

时间:2024-07-07 22:32:07
【文件属性】:

文件名称:Spark内核机制解析及性能调优教程(含资料)

文件大小:6.07MB

文件格式:ZIP

更新时间:2024-07-07 22:32:07

spark,性能,内核,云计算/大数据,Spark,集群,应用,源码

由于Spark基于内存计算的特性,集群的任何资源都可以成为Spark程序的瓶颈:CPU,网络带宽,或者内存。通常,如果内存容得下数据,瓶颈会是网络带宽。不过有时你同样需要做些优化,例如将RDD以序列化到磁盘,来降低内存占用。 本教程通过源码引导读者深入理解Spark的集群部署的内部机制、Spark内部调度的机制、Executor的内部机制、Shuffle的内部机制,进而讲述Tungsten的内部机制,让学员知其然知其所以然。教程的后部分,是任何Spark应用者都很好关注的Spark性能调优的内容。


【文件预览】:
Spark内核机制解析及性能调优教程(含资料)-2020220205120500_43740.zip

网友评论