文件名称:athena:通过本地命令行方便与Hadoop集群进行交互
文件大小:6.19MB
文件格式:ZIP
更新时间:2024-05-23 09:33:20
Python
雅典娜 Athena是一种方便的命令行工具,使您可以与本地终端进行交互并从本地终端查询Hadoop集群,而无需远程SSH会话。 Athena通过提供全面的查询功能和方便的日常任务自动化功能,通过本地命令行的便捷性,使每个数据科学家和工程师的工作变得更加轻松! 特征 查询Impala并在终端中显示结果或将结果保存到CSV文件 在Impala上运行一批查询(在YAML文件中定义),将结果保存到指定的CSV文件中 定义一个或多个查询的报告,并将其邮寄给一个或多个人。 报告以中性且美观的模板呈现。 使用内置的计划程序计划报告。 将特定日期或时间间隔的报告发送给任意数量的人。 将Pig脚本和相关的库/ UDF运送到Hadoop集群并在其中运行。 启动到群集上节点的SSH会话,甚至无需记住主机名/ IP地址即可创建隧道。 仅提供源和目标即可启动分布式复制作业。 与HDFS和S3一起使用。
【文件预览】:
athena-master
----MANIFEST.in(32B)
----.travis.yml(176B)
----example_report.html(15KB)
----tests()
--------test_config.py(367B)
--------test_cli.py(348B)
----tox.ini(390B)
----athena()
--------broadcasting()
--------cli.py(6KB)
--------queries()
--------__init__.py(0B)
--------scheduling()
--------utils()
----setup.cfg(62B)
----requirements.txt(135B)
----setup.py(2KB)
----.gitignore(484B)
----README.md(16KB)
----.editorconfig(173B)
----.gitattributes(11B)
----terminal.gif(6.27MB)