Spark快速数据处理.pdf

时间:2019-12-18 12:24:10
【文件属性】:

文件名称:Spark快速数据处理.pdf

文件大小:18.3MB

文件格式:PDF

更新时间:2019-12-18 12:24:10

Spark

《Spark快速数据处理》系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。


网友评论

  • 这个资料比较老了