(file:///C:/Users/bing/AppData/Local/Temp/msohtmlclip1/01/clip_image002.jpg)]
-
namenode主节点先启动,然后datanode启动,启动后向主节点namenode主节点注册,
-
主节点校验,检验ok就返回集群(cluster)ID和BP-ID给datanode,
-
然后datanode拿着集群ID(cluster)向主节点汇报自己的节点数据信息
-
然后datanode会3s会向namenode发送一个心跳机制(发送心跳机制就是向主节点汇报自己的数据存储的当前情况)
-
Namenode接收心跳,
-
当应该有三个子节点向namenode节点汇报的时候,其中的一个子节点宕机了,namenode中有一个list链表,当检测到少了一个会执行一个程序,会把两台存储完好的数据复制到另一台限制的设备上
-
当namenode十次没有向主节点发送心跳机制了
-
主节点请求namenode端口号(ping namenode),看通没通,如果没有ping通会等5分钟
-
Ping完等五分钟之后还没汇报,再校验一次在等五分钟
-
一个datanode如果十分钟三十秒还没有汇报就直接剔除掉
如果十分钟三十秒还没有汇报就直接剔除掉
r