大数据平台搭建

时间:2021-08-11 14:21:51

本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容:

  • 基础环境安装
  • zookeeper集群的搭建
  • kafka集群的搭建
  • hadoop/hbase集群的搭建
  • spark集群的搭建
  • flink集群的搭建
  • elasticsearch集群的搭建
  • alluxio集群的搭建

1.zookeeper简介

Zookeeper是一个分布式的、开源的分布式应用协调服务,它暴露了一组简单的基础原件,分布式应用可以在这些原件之上实现更高级别的服务,主要使用场景和功能如下:

  • Naming service
  • Configuration management
  • Synchronization
  • Leader election
  • Message Queue
  • Notification system

其集群管理和命名服务在kafka、hadoop、spark中均有相关应用。

2.zookeeper安装

  • 下载

官网地址:http://zookeeper.apache.org/releases.html,本文选择稳定版3.4.8

大数据平台搭建

 

  • 解压安装

本文环境列表

大数据平台搭建

直接在服务器10.20.112.59上执行解压

cd ~
tar -zxvf zookeeper-3.4.8.tar.gz
mv zookeeper-3.4.8 zookeeper

 切换到conf目录,进行配置文件的更改

cd  ~/zookeeper/conf/
mv zoo_sample.cfg zoo.cfg

 修改后的配置文件zoo.cfg如下:

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/wls/oracle/bigdata/zookeeper
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
server.1=SZB-L0045546:2888:3888
server.2=SZB-L0045551:2888:3888
server.3=SZB-L0045552:2888:3888

dataDir主要是存储zookeeper的日志文件和快照信息

server.x中的x(数字1,2,3)主要是zookeeper的主机标识,所有的zookeeper集群中机器均需要在对应的dataDir目录新建myid文件,其内容为x(数字1,2,3)

  • 日志配置更改

默认zookeeper的日志输出信息都打印到了zookeeper.out文件中,这样随着程序的进行,其日志文件会相当大,为便于后续的维护,优化相关配置

(1)日志路径

${ZOOKEEPER_HOME}/bin下更改zkEnv.sh文件,新增ZOO_LOG_DIR配置

vi /wls/oracle/zookeeper/bin/zkEnv.sh

ZOO_LOG_DIR=/wls/oracle/bigdata/zookeeper/log

 大数据平台搭建

(2)日志方式

编辑配置${ZOOKEEPER_HOME}/conf/log4j.properties

vi /wls/oracle/zookeeper/config/log4j.properties

 更改zookeeper.root.logger

大数据平台搭建

同时更改log4j.appender.ROLLINGFILE相关属性

大数据平台搭建

配置更改完成后,将整个zookeeper目录同步到其他服务器

scp -r /wls/oracle/zookeeper oracle@10.20.112.64:/wls/oracle/
scp -r /wls/oracle/zookeeper oracle@10.20.112.65:/wls/oracle/

 各个服务器/wls/oracle/bigdata/zookeeper路径下,配置myid文件

  • 启动和验证

依次启动集群中的zookeeper节点

/wls/oracle/zookeeper/bin/zkServer.sh start

 待节点全部启动完成

/wls/oracle/zookeeper/bin/zkServer.sh status

 大数据平台搭建

同时,执行jps命令,会有QuorumPeerMain的进程存在,至此,zookeeper验证完成。

大数据平台搭建