Apache Hadoop---Pig.docx

时间:2023-07-03 11:21:57
【文件属性】:

文件名称:Apache Hadoop---Pig.docx

文件大小:31KB

文件格式:DOCX

更新时间:2023-07-03 11:21:57

Pig SQL引擎 Hadoop

Pig运行在Hadoop上,是对大型数据集进行分析和评估的平台。它简化了使用Hadoop进行数据分析的要求,提供了一个高层次的、面向领域的抽象语言:PigLatin。通过PigLatin,数据工程师可以将复杂且相互关联的数据分析任务编码为Pig操作上的数据流脚本,通过将该脚本转换为MapReduce任务链,在Hadoop上执行。和Hive一样,Pig降低了对大型数据集进行分析和评估的门槛。


网友评论