hadoop分布式集群搭建前期准备(centos7)

时间:2021-12-24 17:52:06

那玩大数据,想做个大数据的从业者,必须了解在生产环境下搭建集群哇?由于hadoop是apache上的开源项目,所以版本有些混乱,听说都在用Cloudera的cdh5来弄?后续研究这个吧,就算这样搭建不适合真实环境,也算是了解hadoop的一些基本东西了。

  搭建之前要做一些前期的准备,如果买不起服务器那就装虚拟机吧,看了一种用最少的服务器模拟真是环境的搭建方式,需要四台,好吧,整四个虚拟机,事实证明我的坑爹电脑撑得住。

使用vm建立几台虚拟机,首先要知道自己处在什么样的网络环境下,其实直接用nat模式最好,互不受影响。开启nat模式,将自己的虚拟机的网络模式也设置为nat模式。

hadoop分布式集群搭建前期准备(centos7)

先配置一个,剩余的在vm中,右键虚拟机,管理中有一个clone,clone四分然后改了网卡配置就ok了。下面这个是我的网卡配置:

TYPE=Ethernet
BOOTPROTO=static
DEFROUTE=yes
PEERDNS=yes
PEERROUTES=yes
IPV4_FAILURE_FATAL=no
#IPV6INIT=yes
#IPV6_AUTOCONF=yes
#IPV6_DEFROUTE=yes
#IPV6_PEERDNS=yes
#IPV6_PEERROUTES=yes
#IPV6_FAILURE_FATAL=no
IPADDR=192.168.75.117
GATEWAY=192.168.75.2
NETMASK=255.255.255.0
DNS1=192.168.75.2
NAME=eno16777736
UUID=a393e22f-4bae-4ed2--f0247eeddddb
DEVICE=eno16777736
ONBOOT=yes

不知道别的怎么样,centos7在etc/resolv.conf配置了dns重启会失效,配置的注释中也说了,在网卡中以DNS1=x.x.x.x DNS2=x.x.x.x的形式配置就可以了,最主要的是网关和DNS都应该设置为NAT中分配的网关地址,不然你会连接不上外网的,据我猜测dns设置为网关地址就是把dns让路由给代理了。(修改dns不需要重启网卡,测试了确实如此~~)

还有最好开机默认启动脚本模式,不然卡哭了就,这个centos7配置的方式,之前修改什么init 3什么的也不行了:

ln -sf /lib/systemd/system/multi-user.target /etc/systemd/system/default.target

四台机器的内存配置要看你的电脑的情况了,给自己的windows留点....

hadoop分布式集群搭建前期准备(centos7)

接下该再复习一下ssh免密码登录啦~~~