介绍
zeppelin主要有以下功能
- 数据提取
- 数据发现
- 数据分析
- 数据可视化
目前版本(0.5-0.6)之前支持的数据搜索引擎有如下
安装
环境
centOS 6.6
编译准备工作
sudo yum update
sudo yum install openjdk-7-jdk
sudo yum install git
sudo yum install npm
下载源码
git clone https://github.com/apache/incubator-zeppelin.git
编译,打包
cd incubator-zeppelin
#build for spark 1.4.x ,hadoop 2.4.x
mvn clean package -Pspark-1.4 -Dhadoop.version=2.4.0 -Phadoop-2.4 -DskipTests -P build-distr
结果会生成在zeppelin-distribution/target
下
解压
tar -zxvf zeppelin-0.6.0-incubating-SNAPSHOT.tar.gz
修改配置,在zeppelin-site.xml中可以修改端口号等信息,zeppelin-env.sh中修改一些启动环境变量。
cp zeppelin-site.xml.template zeppelin-site.xml
cp zeppelin-env.sh.template zeppelin-env.sh
启动zeppelin
./bin/zeppelin-daemon.sh start
关闭zeppelin(记得要用命令关闭,不然你很可能再也起不来,别问我怎么知道的。)
./bin/zeppelin-daemon.sh stop
web ui
安装环节至此结束,后续使用篇主要是hive与spark-sql的可视化使用,有时间将慢慢添加。