Spark2.X环境准备、编译部署及运行

时间:2023-12-22 11:06:20

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

下载地址 :https://www.apache.org/dyn/closer.lua/spark/spark-2.2.0/spark-2.2.0.tgz

Spark2.X环境准备、编译部署及运行

我们把spark放在节点2上

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

下面我们把jdk换成1.8的

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

配置环境变量

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

使环境变量生效

Spark2.X环境准备、编译部署及运行

重启后

Spark2.X环境准备、编译部署及运行

另外两个节点的做法一样,这里就不多说了

Spark2.X环境准备、编译部署及运行

上传maven包

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

配置maven的环境变量

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

#java
export JAVA_HOME=/opt/modules/jdk1..0_60
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin #maven
export MAVEN_HOME=/opt/modules/apache-maven-3.3.
export PATH=$PATH:$MAVEN_HOME/bin
export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024M"

使其环境变量生效

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

找到这一串,把他删除掉

Spark2.X环境准备、编译部署及运行

改成

Spark2.X环境准备、编译部署及运行

VERSION=2.2.0
SCALA_VERSION=2.11.8
SPARK_HADOOP_VERSION=2.6.0
SPARK_HIVE=1

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

我们可以参考官网的教程说明

http://spark.apache.org/docs/2.2.0/building-spark.html

Spark2.X环境准备、编译部署及运行

我们运行一下

Spark2.X环境准备、编译部署及运行

./dev/make-distribution.sh --name custom-spark --tgz -Phadoop-2.6 -Phive -Phive-thriftserver  -Pyarn

这个过程非常长,网络好机器配置好的话也许一个小时吧,如果中途网络不好失败的话就重新来吧Spark2.X环境准备、编译部署及运行

我自己这里也是经过了一次失败之后,再重新运行一次这条语句就可以了,当看到build success字样的时候就说明成功了

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

在spark的目录下会多了一个踏包

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

改一下名字

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

解压

Spark2.X环境准备、编译部署及运行

接下来配置环境变量

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

#scala
export SCALA_HOME=/opt/modules/scala-2.11.
export PATH=$PATH:$SCALA_HOME/bin

使环境变量生效

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

读取文件

Spark2.X环境准备、编译部署及运行

统计有多少行

Spark2.X环境准备、编译部署及运行

文件的第一行

Spark2.X环境准备、编译部署及运行

前4行

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

我们先新建一个数据文件

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

把文件读取进来

Spark2.X环境准备、编译部署及运行

用空格切分

Spark2.X环境准备、编译部署及运行

以key value对的方式显示出来

Spark2.X环境准备、编译部署及运行

这里报错

Spark2.X环境准备、编译部署及运行

下面我们打开spark的系统监控页面

Spark2.X环境准备、编译部署及运行

Spark2.X环境准备、编译部署及运行

创建缓存

Spark2.X环境准备、编译部署及运行

使用一下

Spark2.X环境准备、编译部署及运行

这里就有反馈了Spark2.X环境准备、编译部署及运行