spark 入门学习教程

时间:2020-03-24 17:53:15
【文件属性】:

文件名称:spark 入门学习教程

文件大小:32.39MB

文件格式:ZIP

更新时间:2020-03-24 17:53:15

spark 入门教程

Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache*项目,速度之快足见过人之处,Spark以其先进的设计理念,迅速成为社区的热门项目,围绕着Spark推出了Spark SQL、Spark Streaming、MLLib和GraphX等组件,也就是BDAS(伯克利数据分析栈),这些组件逐渐形成大数据处理一站式解决平台。从各方面报道来看Spark抱负并非池鱼,而是希望替代Hadoop在大数据中的地位,成为大数据处理的主流标准,不过Spark还没有太多大项目的检验,离这个目标还有很大路要走。 Spark使用Scala语言进行实现,它是一种面向对象、函数式编程语言,能够像操作本地集合对象一样轻松地操作分布式数据集(Scala 提供一个称为 Actor 的并行模型,其中Actor通过它的收件箱来发送和接收非同步信息而不是共享数据,该方式被称为:Shared Nothing 模型)。在Spark官网上介绍,它具有运行速度快、易用性好、通用性强和随处运行等特点。


【文件预览】:
8.SparkMLlib(上)--机器学习及SparkMLlib简介.pdf
1.Spark及其生态圈简介.pdf
5.Hive(下)--Hive实战.pdf
6.SparkSQL(下)--Spark实战应用.pdf
6.SparkSQL(上)--SparkSQL简介.pdf
2.Spark编译与部署(下)--Spark编译安装.pdf
3.Spark编程模型(下)--IDEA搭建及实战.pdf
8.SparkMLlib(下)--SparkMLlib实战.pdf
7.SparkStreaming(上)--SparkStreaming原理介绍.pdf
9.SparkGraphX介绍及实例.pdf
7.SparkStreaming(下)--SparkStreaming实战.pdf
2.Spark编译与部署(中)--Hadoop编译安装.pdf
2.Spark编译与部署(上)--基础环境搭建.pdf
5.Hive(上)--Hive介绍及部署.pdf
4.Spark运行架构.pdf
10.分布式内存文件系统Tachyon介绍及安装部署.pdf
3.Spark编程模型(上)--概念及SparkShell实战.pdf
6.SparkSQL(中)--深入了解运行计划及调优.pdf

网友评论

  • 不错,很清晰,拆分比较明白
  • 这笨 不错 正好我学