文件名称:hive:这个目录包含我所有基于Apache Hive程序的项目
文件大小:6KB
文件格式:ZIP
更新时间:2024-04-22 21:34:19
HiveQL
Apache Hive项目 该存储库包含Python或Scala中基于Apache Hive的项目。 希望每个目录都包含两个实现。 有关每个项目及其规格的全面说明,请参见项目目录。 training_project_1 该项目在给定的一天(2020年10月20日)中获取来自Wikipedia的点击流和页面修订数据,并探究一些有关站点访问者的有趣问题,例如在给定的一天中哪个页面的访问者最多,哪些页面的内部流量最多。
【文件预览】:
hive-main
----training_project_1()
--------question_queries.hql(3KB)
--------directory-and-data-setup.sh(4KB)
--------clickstream_data_insertion_and_mod.hql(2KB)
--------data_insertion_and_mod.hql(3KB)
--------readme.md(3KB)
--------table-setup.hql(4KB)
----README.md(560B)