pig

时间:2024-04-20 03:39:58
【文件属性】:

文件名称:pig

文件大小:14.13MB

文件格式:GZ

更新时间:2024-04-20 03:39:58

数据库

Apache Pig是一个用于分析大型数据集的平台,该平台包含用于表达数据分析程序的高级语言,以及用于评估这些程序的基础结构。 Pig程序的显着特性是它们的结构适合于实质上的并行化,从而使它们能够处理非常大的数据集。 Pig的基础结构层由一个生成Map-Reduce程序序列的编译器组成。 Pig的语言层由一种称为Pig Latin的文本语言组成,它具有以下关键属性:*易于编程。 实现简单的“令人尴尬的并行”数据分析任务的并行执行是微不足道的。 包含多个相互关联的数据转换的复杂任务被明确编码为数据流序列,从而使其易于编写,理解和维护。 *优化机会。 任务的编码方式允许系统自动优化其执行,从而使用户可以专注于语义而不是效率。 *可扩展性。 用户可以创建自己的功能来进行特殊处理。https://mirrors.tuna.tsinghua.edu.cn/apache/pig/pig-0.16.0/


网友评论