相关网址
ambari下载地址
https://docs.hortonworks.com/HDPDocuments/Ambari-2.7.3.0/bk_ambari-installation/content/ambari_repositories.html
找里面对应系统版本, 后面jar包的那个
hdp下载地址
https://docs.hortonworks.com/HDPDocuments/Ambari-2.7.3.0/bk_ambari-installation/content/hdp_31_repositories.html .html
初次书写,逻辑还不是很全面严谨,敬请谅解
若有命令错误,联系本人,确认修改, 感谢理解
一、集群搭建前的准备(已有准备可跳过)
1、各主机系统功能和角色定义,心里先有个底,比如哪台是masts主机
,几个节点,数据库在哪台,IP地址以及主机名称,若无基础,可列表,作为实际的参考表下方使用。
2、准备文件 包含:HDP包,HDP-UTILS包,JAVA环境和jdbc的jar包
3、每台电脑要安装vim,ssh ;主节点要安装apache2或者其他httpd服务器,作为本地源使用
4、建议passwd root 修改密码, 用su 提权操作, 若用默认用户操作,几乎下方每一条命令都需要sudo 提权
二、集群准备工作(若有成品,可以跳过)
1、IP地址配置
sudo vim /etc/netplan/50-cloud-init.yaml
sudo netplan apply
vim /etc/resolv.conf
此项不详细描述,安装操作系统时候可以在配置服务器时候直接设置ip地址
2、hosts文件配置
添加你的节点地址与节点主机名的映射, 这里有一点要注意,127.0.0.1后面只能跟localhost ,如若存在其他的的127与主机名的映射一定要删掉,否则会造成后面主机监听IP为127.0.0.1,而不是局域网中的主机地址,凡是涉及到相关服务将无法启动.
127.0.0.1 localhost
#127.0.0.1 master 此条若存在,将其删掉改为实际的网络地址映射
192.168.3.1 master
192.168.3.2 slave
192.168.3.3 slave
3、SSH免密登录配置
三台互为免密登录,顺序为
#每一台都要生成**
ssh-****** -t rsa
#在用户目录下的.ssh文件夹下创建authorized_keys文件
touch /root/.ssh/authorized_keys
#将每一台的公钥内容拷贝在该文件里
cat /root/.ssh/id_rsa.pub > /root/.ssh/authorized_keys
#注:该命令只是把当前电脑的公钥拷在该文件里, 实际过程中需要降所有的公钥拷都拷贝在这个文件里, 可以搭配下面的命令来完成
#将该文件拷贝到每一台电脑
scp ./root/home/.ssh.id_rsa.pub [email protected][目标IP地址]:/root/.ssh/
#我用的是root用户,不同的用户创建的**在不同的用户目录下面
注:ubuntu的ssh需要修改配置文件才可以通过远程ssh登录,修改方法如下
Vim /etc/ssh/sshd_config
将一下两项修改为yes
PasswordAuthentication yes
PermitRootLogin yes
4、ntp服务器
apt install ntp
update-rc.d ntp defaults
5、防火墙
端口较多,建议关闭防火墙,后续的端口占用可以在ambari里面修改
ufw disable
4、JAVA环境配置
三、本地源的配置
这里的配置比较简单,查询你本机的apache2的服务器的html主目录在哪里, 入默认在/var/http/www/html/下
1、准备包
#将准备好的包传到安装由apache2的电脑并解压
tar -zxvf ./[包名] /var/http/www/html/
#命令在包当前位置操作
2、添加**并更新(需要互联网,并且在每一台电脑执行)
apt-key adv --recv-keys --keyserver keyserver.ubuntu.com B9733A7A07513CAD
3、在 /etc/apt/sources.list.d/ 中创建ambari.list文件,并将本地源位置写入其中
deb http://[计算机局域网地址]/ambari/ubuntu18/2.7.3.0-139 Ambari main
#注:可通过浏览html来验证地址是否正确,访问到ubuntu18即可,在下一层打不开
4、完成后更新列表
apt update
四、开始安装
1、从节点
apt install ambari-agent
2、主节点
ambari-server setup
注:安装过程中,遇到是否配置JAVA环境要选Y ,并把JAVA 环境配置进去,否则你将会进入漫长的下载。
如果要修改数据库,要确保数据库可以被连接 , 默认安装pg数据库并且自动配置
3、安装数据库连接,此处和你后期hive元数据的数据库相对应,练习安装mysql即可
#要提前准备好jar传入服务器,自己能找得到的文件夹
ambari-server setup --jdbc-db=[数据库名字] --jdbc-driver=/[jdbcjar包路径]/[jar包名]
#例:ambari-server setup --jdbc-db=mysql --jdbc-driver=/usr/java/mysql_connect.jar
4、开启服务
ambari-server start
五、集群生成
1、访问地址,masterIP,端口号8080。用户名:admin 密码:admin
然后开始网页向导安装
需要注意的是:
1、Select Version:
选择本地库
并将其他系统包删除,保留你本机系统对应的包地址,填入本地HDP,HDP-UTILS的包地址
填入全部的电脑地址,然后将master的主机私有**拷贝在框中
等完成后按照只是下一步并进行选择服务
一定要按需添加,集群对内存要求较高,内存不足会是集群奔溃
选择要连接的数据库,按照指示填入相应的参数,这里集群内置了mysql 可以默认创建,用来测试环境
注:连接数据库一定要注意添加 jdbc文件,参考上面步骤
然后就是最后的安装 , 因时间原因,文章可能存在不全面的地方,回复补充
小提示:
1、 集群的主节点的内存一定要大, 最好有固态支撑
2、连接数据库都要添加jdbc文件,具体参照第四块3部分
3、ssh免密要验证,hosts文件里面必须存在localhost 127.0.0.1的映射 ,绝对不能存在[主机名] 120.0.0.1的映射
4、hive 可能存在 端口占用,在关闭hive的情况下找到ambari的设置里面,找所冲突端口修改一下保存重启即可