Spark2.X环境准备、编译部署及运行

下载地址：https://www.apache.org/dyn/closer.lua/spark/spark-2.2.0/spark-2.2.0.tgz

我们把spark放在节点2上

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

下面我们把jdk换成1.8的

Spark2.X环境准备、编译部署及运行

配置环境变量

Spark2.X环境准备、编译部署及运行

使环境变量生效

Spark2.X环境准备、编译部署及运行

重启后

Spark2.X环境准备、编译部署及运行

另外两个节点的做法一样，这里就不多说了

Spark2.X环境准备、编译部署及运行

上传maven包

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

配置maven的环境变量

Spark2.X环境准备、编译部署及运行

#java

export JAVA_HOME=/opt/modules/jdk1..0_60

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

#maven

export MAVEN_HOME=/opt/modules/apache-maven-3.3.

export PATH=$PATH:$MAVEN_HOME/bin

export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024M"

使其环境变量生效

Spark2.X环境准备、编译部署及运行

找到这一串，把他删除掉

Spark2.X环境准备、编译部署及运行

改成

Spark2.X环境准备、编译部署及运行

VERSION=2.2.0

SCALA_VERSION=2.11.8

SPARK_HADOOP_VERSION=2.6.0

SPARK_HIVE=1

Spark2.X环境准备、编译部署及运行

我们可以参考官网的教程说明

http://spark.apache.org/docs/2.2.0/building-spark.html

Spark2.X环境准备、编译部署及运行

我们运行一下

Spark2.X环境准备、编译部署及运行

./dev/make-distribution.sh --name custom-spark --tgz -Phadoop-2.6 -Phive -Phive-thriftserver  -Pyarn

这个过程非常长，网络好机器配置好的话也许一个小时吧，如果中途网络不好失败的话就重新来吧 Spark2.X环境准备、编译部署及运行

我自己这里也是经过了一次失败之后，再重新运行一次这条语句就可以了，当看到build success字样的时候就说明成功了

Spark2.X环境准备、编译部署及运行

在spark的目录下会多了一个踏包

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

改一下名字

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

接下来配置环境变量

Spark2.X环境准备、编译部署及运行

#scala

export SCALA_HOME=/opt/modules/scala-2.11.

export PATH=$PATH:$SCALA_HOME/bin

使环境变量生效

Spark2.X环境准备、编译部署及运行

读取文件

Spark2.X环境准备、编译部署及运行

统计有多少行

Spark2.X环境准备、编译部署及运行

文件的第一行

Spark2.X环境准备、编译部署及运行

前4行

Spark2.X环境准备、编译部署及运行

我们先新建一个数据文件

Spark2.X环境准备、编译部署及运行

把文件读取进来

Spark2.X环境准备、编译部署及运行

用空格切分

Spark2.X环境准备、编译部署及运行

以key value对的方式显示出来

Spark2.X环境准备、编译部署及运行

这里报错

Spark2.X环境准备、编译部署及运行

下面我们打开spark的系统监控页面

Spark2.X环境准备、编译部署及运行

创建缓存

Spark2.X环境准备、编译部署及运行

使用一下

秒客网

Spark2.X环境准备、编译部署及运行

相关文章