HUE=Hadoop User Experience(Hadoop用户体验),直白来说就一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用HUE我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。
操作HDFS上的数据(并且进行文件和目录的创建、复制、删除、下载以及修改权限等操作),运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等;
SQL编辑器,支持Hive, Impala, MySQL, Oracle, PostgreSQL, SparkSQL, Solr SQL, Phoenix…
搜索引擎Solr的各种图表
Spark和Hadoop的友好界面支持
支持调度系统Apache Oozie,可进行workflow的编辑、查看;
hue的使用是第三方依赖
tsv 以\t分割
csv以,分割
HDFS家目录:user/root
user/kris
hue官网:http://gethue.com/
hue是依赖oozie,所以需要先安装oozie;
在mysql中创建这两个库
oozie数据库
create database oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
hue数据库
create database hue DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
自动化安装oozie
安装HUE之前先装这个库
因hue是python写的,所以要先安装个库;
[root@hadoop104 software]# rpm -ivh MySQL-shared-compat-5.6.41-1.el6.x86_64.rpm
warning: MySQL-shared-compat-5.6.41-1.el6.x86_64.rpm: Header V3 DSA/SHA1 Signature, key ID 5072e1f5: NOKEY
Preparing... ########################################### [100%]
1:MySQL-shared-compat
进入HUE,点击进入它的web页面
创建账户root,密码root