Hadoop学习笔记（2）hadoop框架解析

时间：2022-02-18 15:16:56

Hadoop是适合大数据的分布式存储与计算平台

HDFS的架构：主从式结构

主节点只有一个NameNode，从节点可以有很多个DataNode。

NameNode负责：

(1)接收用户操作请求

(2)维护文件系统的目录结构

(3)管理文件与block之间关系，block与DataNode之间联系

DataNode负责：

(1)存储文件

(2)文件被分成block存储在磁盘上

(3)为保证数据安全，文件会有多个副本

NameNode和DataNode是指不同的独立的物理机器。

类比：积木拼图，NameNode就是说明书，每一个积木块就是DataNode。

MapReduce的架构：主从式结构

主节点只有一个JobTracker，从节点可以有很多个TaskTracker。

JobTracker负责：

(1)接收客户提交的计算任务

(2)把计算任务分给TaskTracker执行

(3)监控TaskTracker的执行情况

TaskTracer负责：

(1)执行JobTracer分配的计算任务

Hadoop的物理集群分布：

Hadoop学习笔记（2）hadoop框架解析

上面的每一个结点，不论是主节点还是从节点，本质上都是一个java进程。

单个结点的物理结构：

Hadoop学习笔记（2）hadoop框架解析

所以Hadoop的特点：

(1)分布式:扩容能力强、成本低、高效率

(2)副本机制：可靠性高

相关文章

