SparkInternals:有关Apache Spark设计和实现的说明

时间:2024-03-13 05:06:56
【文件属性】:

文件名称:SparkInternals:有关Apache Spark设计和实现的说明

文件大小:63.9MB

文件格式:ZIP

更新时间:2024-03-13 05:06:56

Spark内部 Spark版本:1.0.2 Doc版本:1.0.2.0 作者 微博/ Twitter ID 姓名 会费 徐立杰 作者的原始中文版本,以及英文版本更新 韩菊 英文版和更新(第0、1、3、4和7章) 郝仁 英文版和更新(第2、5和6章) Bhuridech Sudsee 泰文版 介绍 本系列讨论Apache Spark的设计和实现,重点在于其设计原理,执行机制,系统架构和性能优化。 此外,在设计和实现方面与Hadoop MapReduce进行了一些比较。 我不愿意将此文档称为“代码演练”,因为目标不是分析项目中的每段代码,而是以系统的方式了解整个系统(通过分析Spark作业的执行过程,从创建到完成)。 有很多讨论计算机系统的方法。 在这里,我们选择了一种问题驱动的方法。 首先介绍了一个具体问题,然后对其进行了逐步分析。 我们将从一个典型的Spark示例工作开始,然


网友评论