文件名称:流程图+方框图剖析大数据技术(HDFS&Hadoop; MapReduce)
文件大小:682KB
文件格式:PDF
更新时间:2022-03-25 03:08:01
HADOOP
大数据技术的两个基本要点是分布式存储和多点并行运算,Hadoop的分布式文件系统HDFS和并行运算框架Hadoop MapReduce分别予以了实现。计算机集群中的每个节点既是存储节点,也是运算节点,HDFS将大数据文件分布存储在集群中的各个节点,并通过MapReduce编程框架将用户定义的算法“输送”至各数据节点执行运算。实现了更广泛更灵活的运算与存储资源的调度。