文件名称:Apache-Spark-Quick-Start-Guide:Packt发布的Apache Spark快速入门指南
文件大小:1021KB
文件格式:ZIP
更新时间:2024-06-16 16:29:47
HTML
Apache Spark快速入门指南 这是Packt发布的的代码库。 快速学习使用Apache Spark编写高效的大数据应用程序的技巧 这本书是关于什么的? Apache Spark是一个灵活的框架,允许处理批处理和实时数据。 它的统一引擎使其在大数据用例中非常受欢迎。 本书将帮助您开始使用Apache Spark 2.0并为各种用例编写大数据应用程序。 本书涵盖以下激动人心的功能: 了解RDD,DataFrame,转换等核心概念 设置Spark开发环境 选择适合您的应用程序的API 了解Spark的架构和Spark应用程序的执行流程 探索用于SQL,流,ML和图分析的内置模块 优化您的Spark作业以获得更好的性能 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代码都组织在文件夹中。 例如,Chapter02。 以下是您需要编写本书的内容:本书针对希望动手入门以充
【文件预览】:
Apache-Spark-Quick-Start-Guide-master
----Chapter05()
--------sales.csv(228B)
--------Chapter5.html(98KB)
--------example.png(288KB)
--------Screen Shot 2019-01-18 at 11.34.55 PM.png(105KB)
--------example.py(395B)
----Chapter04()
--------Chap4_Encoders.html(88KB)
--------Chap4_Scala.html(93KB)
--------Chap4_Python.ipynb(22KB)
--------sample_10000.txt(991KB)
----Chapter03()
--------Chapter3.html(406KB)
--------sampleFile.log(503B)
----Chapter07()
--------Machine Learning & Graph()
--------Streaming()
----LICENSE(1KB)
----README.md(5KB)
----Chapter06()
--------chapter6_udf_scala.html(77KB)
--------Chapter6_MySql.html(77KB)
--------Chapter6_sql.html(94KB)
----Chapter08()
--------Chapter 8.html(129KB)