SparkInternals:学习Apache Spark源代码的笔记-spark source code

时间:2024-04-13 14:50:22
【文件属性】:

文件名称:SparkInternals:学习Apache Spark源代码的笔记-spark source code

文件大小:1.69MB

文件格式:ZIP

更新时间:2024-04-13 14:50:22

系统开源

Apache Spark源码阅读 概述 本文档是我去年(2014)年末学习二进制时所留下的阅读笔记,原为Microsoft Word文档。近期出于毕业求职需要,重温源码,顺带整理了下原文档,转换成Markdown文档,修正记者中出现的一些错误,对缺漏之处也已经相应补充全。整理过后的文档会放在我的和上。 本文档对应的Apache Spark原始版本为{{book.sparkVersion}} 。代码仓库中,不同分支表示不同版本的Spark。 本人经验,能力以及实验条件实在是有限的,在研究过程中难免会有很多不足。若在阅读本文档时发现有错误与遗漏之处,还望能够提出指正。 如何阅读 在学习过程中,马·萨里亚发表的论文弹性分布式数据集:容错的抽象内存中的集群计算和他的博士毕业论文的体系结构快速通用数据处理大型集群,杰里铅关于Apache的星火内部机制的,ColZer关于Apache Spark的,等


【文件预览】:
SparkInternals-master
----section3()
--------README.md(14KB)
----SUMMARY.md(1KB)
----media()
--------images()
--------Original_Files()
----book.json(60B)
----README.md(5KB)
----.gitignore(401B)
----section1()
--------partitioner.md(20KB)
--------computeFunction.md(7KB)
--------README.md(4KB)
--------rddDependencies.md(14KB)
--------rddPartitions.md(11KB)

网友评论