文件名称:spark-training:用于Spark培训的存储库
文件大小:5.16MB
文件格式:ZIP
更新时间:2024-02-26 17:24:18
python scala spark hive hadoop
Spark培训资料库 该存储库包含由dimajix进行的Spark和Hadoop培训的许多不同示例,练习和教程。 您随时可以在GitHub上找到最新版本 https://github.com/dimajix/spark-training 内容 存储库包含不同类型的文档 Spark / Scala的源代码 适用于PySpark的Jupyter笔记本 Zeppelin笔记本用于Spark / Scala Hive SQL脚本 猪脚本 ...以及更多 外部依赖 一些笔记本需要在S3上s3:// dimajix-training / data /上由dimajix提供的一些测试数据。 建筑可执行文件