spark集群详细搭建过程及遇到的问题解决（四）

在spark集群详细搭建过程及遇到的问题解决（三）中，我们将讲述了hadoop的安装过程，在本文中将主要讲述spark的安装配置过程。

spark@master:~/spark$ cd hadoop
spark@master:~/spark/hadoop$ cd $SPARK_HOME/conf
spark@master:~/spark/spark/conf$ cp slaves.template slaves 
spark@master:~/spark/spark/conf$ vim slaves

添加以下内容

spark@master:~/spark/spark/conf$ cp spark-env.sh.template spark-env.sh

spark-env.sh 为Spark进程启动时需要加载的配置

改模板配置中有选项的具体说明，此处参考稍微加入了一些配置:

spark@master:~/spark/spark/conf$ vim spark-env.sh

添加以下内容

export SPARK_PID_DIR=/home/spark/spark/spark/tmp/pidexport SCALA_HOME=/home/spark/spark/scalaexport JAVA_HOME=/home/spark/spark/jdkexport HADOOP_HOME=/home/spark/spark/hadoopexport SPARK_MASTER_IP=masterexport SPARK_MASTER_PORT=7077export SPARK_WORKER_MERMORY=2Gexport HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

注意更改相应的目录，并保存。

spark@master:~/spark/spark/conf$  hadoop fs -mkdir hdfs://master:9000/sparkHistoryLogsmkdir: Cannot create directory /sparkHistoryLogs. Name node is in safe mode.

发现不能创建，并提示Name node处于安全模式，因此我们先关掉安全模式

spark@master:~/spark/spark/conf$ hdfs dfsadmin -safemode leaveSafe mode is OFF

重新建立

spark@master:~/spark/spark/conf$  hadoop fs -mkdir hdfs://master:9000/sparkHistoryLogs

spark@master:~/spark/spark/conf$ cp spark-defaults.conf.template spark-defaults.conf

配置spark-defaults.conf，该文件为spark提交任务时默认读取的配置文件

spark@master:~/spark/spark/conf$ vim spark-defaults.conf

添加以下内容

spark.master                     spark://master:7077spark.eventLog.enabled           truespark.eventLog.dir               hdfs://master:9000/sparkHistoryLogsspark.eventLog.compress          truespark.history.updateInterval     5spark.history.ui.port            7777spark.history.fs.logDirectory    hdfs://master:9000/sparkHistoryLogs

将配置好的spark文件复制到worker1、worker2节点中

切换到worker1节点中，执行

spark@worker1:~/spark$ scp -r spark@master:/home/spark/spark/spark ./spark

切换到worker2节点中，执行

spark@worker2:~/spark$ scp -r spark@master:/home/spark/spark/spark ./spark

切换到master中

接着启动spark

spark@master:~/spark/spark/conf$ $SPARK_HOME/sbin/start-all.sh

starting org.apache.spark.deploy.master.Master, logging to /home/spark/spark/spark/logs/spark-spark-org.apache.spark.deploy.master.Master-1-master.outmaster: starting org.apache.spark.deploy.worker.Worker, logging to /home/spark/spark/spark/logs/spark-spark-org.apache.spark.deploy.worker.Worker-1-master.outworker2: starting org.apache.spark.deploy.worker.Worker, logging to /home/spark/spark/spark/logs/spark-spark-org.apache.spark.deploy.worker.Worker-1-worker2.outworker1: starting org.apache.spark.deploy.worker.Worker, logging to /home/spark/spark/spark/logs/spark-spark-org.apache.spark.deploy.worker.Worker-1-worker1.out

可以看到启动成功，

停止spark 使用

$SPARK_HOME/sbin/stop-all.sh

启动Spark历史任务记录:

spark@master:~/spark/spark/conf$ $SPARK_HOME/sbin/start-history-server.sh

starting org.apache.spark.deploy.history.HistoryServer, logging to /home/spark/spark/spark/logs/spark-spark-org.apache.spark.deploy.history.HistoryServer-1-master.out

查看Spark和Hadoop相关的所有进程

spark@master:~/spark/spark/conf$ jps -l

6711 org.apache.hadoop.hdfs.server.namenode.NameNode18863 org.apache.spark.deploy.master.Master7053 org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode18966 org.apache.spark.deploy.worker.Worker19122 sun.tools.jps.Jps19070 org.apache.spark.deploy.history.HistoryServer15529 org.apache.hadoop.hdfs.server.datanode.DataNode7352 org.apache.hadoop.yarn.server.nodemanager.NodeManager7222 org.apache.hadoop.yarn.server.resourcemanager.ResourceManager

至此Spark集群也已经运行成功。

Spark-shell测试Spark集群:

需要先执行

hdfs dfsadmin -safemode leave

将安全模式关闭

spark@master:~/spark/spark/conf$ $SPARK_HOME/bin/spark-shell --master spark://master:7077

可以看到启动成功

测试一下：

一些web浏览界面:

集群节点信息:http://master:8080，可以将master换成ip地址

历史任务：http://master:7777，因为没有执行任务，所以看不到

Hadoop 集群信息: http://master:50070/

图中显示安全模式已经关闭，接下来重新打开hadoop集群，则需要执行下列命令

spark@master:~/spark/spark/conf$ hdfs dfsadmin -safemode enter

至此，已经全部安装完毕。

若想停止spark集群则执行

spark@master:~/spark/spark/conf$ $SPARK_HOME/sbin/stop-all.sh

master: stopping org.apache.spark.deploy.worker.Workerworker2: stopping org.apache.spark.deploy.worker.Workerworker1: stopping org.apache.spark.deploy.worker.Workerstopping org.apache.spark.deploy.master.Master

若想停止hadoop集群则执行

spark@master:~/spark/spark/conf$ $HADOOP_HOME/sbin/stop-all.sh

This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.shStopping namenodes on [master]master: no namenode to stopmaster: stopping datanodeworker1: stopping datanodeworker2: stopping datanodeStopping secondary namenodes [0.0.0.0]0.0.0.0: no secondarynamenode to stopstopping yarn daemonsno resourcemanager to stopmaster: no nodemanager to stopworker1: no nodemanager to stopworker2: no nodemanager to stopno proxyserver to stop

最后附一些常用检测命令：来自（http://ciscolinux.blog.51cto.com/746827/1313110）

1.查看端口是否开启

netstat -tupln | grep 9000

netstat -tupln | grep 9001

2.访问master（NameNode）和slave（JobTracker）启动是否正常http://192.168.0.202:50070和50030

3.jps查看守护进程是否运行

master显示：Job TrackerJpsSecondaryNameNod NameNode

slave显示：DataNode JpsTaskTracker

4.查看集群状态统计信息（hadoopdfsadmin -report）

master和slave输入信息：

九、常用命令

hadoop dfs -ls #列出HDFS下文件

hadoop dfs -ls in #列出HDFS下某个文档中的文件

hadoop dfs -put test.txt test #上传文件到指定目录并且重新命名，只有所有的DataNode都接收完数据才算成功

hadoop dfs -get in getin #从HDFS获取文件并且重新命名为getin，同put一样可操作文件也可操作目录

hadoop dfs -rmr out #删除HDFS上的out目录

hadoop dfs -cat in/* #查看HDFS上in目录的内容

hadoop dfsadmin -safemode leave #退出安全模式

hadoop dfsadmin -safemode enter #进入安全模式

添加一个新的节点

请按照worker1和worker2的配置步骤，即可

本文出自 “lefteva” 博客，请务必保留此出处http://lefteva.blog.51cto.com/11892835/1874268

秒客网

spark集群详细搭建过程及遇到的问题解决（四）

相关文章