文件名称:Spark-权威指南:Spark:权威指南的代码存储库
文件大小:280.88MB
文件格式:ZIP
更新时间:2024-03-18 23:23:29
Scala
Spark:权威指南 这是与相关的所有材料的*资料库 Bill Chambers和Matei Zaharia撰写。 这个资料库目前仍在进行中,随着时间的推移会增加新的资料。 书中的代码 您可以从code子文件夹的书中找到代码,在该code中,可以按语言和章节对code进行细分。 如何运行代码 在本地计算机上运行 要在本地计算机上运行该示例,请将data子文件夹中的所有数据拉到计算机上的/data或指定本地计算机上该特定数据集的路径。 在Databricks上运行 要在Databricks上运行这些模块,您将需要做两件事。 注册新账号。 你可以在做。 导入单个笔记本以在平台上运行 Databricks是一个零管理云平台,可提供: 完全托管的Spark集群 一个用于探索和可视化的交互式工作区 生产管道调度程序 一个为您喜欢的基于Spark的应用程序提供动力的平台 导入说明 导航到您要