文件名称:HadoopMapReduce:学习 Apache(大)数据库框架 - Hadoop、Pig、Hive、Hbase
文件大小:28KB
文件格式:ZIP
更新时间:2024-08-07 15:54:41
Java
概要 目标是学习 Apache(大)数据库框架 - Hadoop、Pig、Hive、Hbase 描述 目前在 2 个数据集上有 3 个项目: 百万歌曲数据集 Most_Popular_Genres :使用非常简单的流派识别(Apache Hive 与 Apache Pig)确定“21 世纪最流行的音乐流派”。 航空公司数据集 Average_Flight_Delay_Per_Month :计算给定日期范围内(Plain Map Reduce vs Apache Pig)一对出发地和目的地之间所有两航段航班的平均延迟。 Airline_Monthly_Delay_Pattern :计算每个航空公司的每月延误模式(Apache Hbase 与二级排序)。 有关详细信息,请参阅特定于项目的自述文件 测试 使用 Amazon EMR 在特定数据集上进行测试 参考
【文件预览】:
HadoopMapReduce-master
----Average_Flight_Delay_Per_Month()
--------pig()
--------java()
--------README.md(1KB)
----Airline_Monthly_Delay_Pattern()
--------secondary_sort()
--------hbase()
--------keypair()
--------README.md(2KB)
----Most_Popular_Genres()
--------pig()
--------README.md(3KB)
--------hive()
----README.md(1KB)