文件名称:testAssignment
文件大小:7.15MB
文件格式:ZIP
更新时间:2024-04-21 10:44:16
Java
阿帕奇·特兹(Apache Tez) Apache Tez是一个通用的数据处理管道引擎,被设想为用于更高抽象的低级引擎,例如Apache Hadoop Map-Reduce,Apache Pig,Apache Hive等。 从本质上讲,tez非常简单,只有两个组成部分: 数据处理流水线引擎可以在其中插入输入,处理和输出实现,以执行任意数据处理。 tez中的每个“任务”都有以下内容: 用于从中消费键/值对的输入。 处理器来处理它们。 输出以收集已处理的键/值对。 数据处理应用程序的主机,通过它可以将上述任意数据处理“任务”组合到任务DAG中,以根据需要处理数据。 通用主机被实现为Apache Hadoop YARN ApplicationMaster。