文件名称:基于Mahout框架的Hadoop平台作业日志分析平台设计与实现 (2015年)
文件大小:974KB
文件格式:PDF
更新时间:2024-05-27 02:24:38
工程技术 论文
随着 Hadoop 的流行与 Hadoop Yarn 的出现,集群的规模越来越大。在 Hadoop 生态圈中对集群运行状态的开源实现已经很成熟,但是尚未有对一个对 Hadoop 作业的运行趋势进行统计分析的平台。本文介绍了一个面向Hadoop Yarn的作业资源统计分析平台,面向集群管理员与普通用户,以时间、用户双维度对作业进行统计分析,得出一个Hadoop作业运行的标准。