一、日志收集项目案例
1.
oozie中依赖jar包
在工作目录下创建lib目录,上传依赖包的lib目录下
2. 作业
将日志收集与处理项目案例使用oozie的workflow执行
3. coordinator
在workflow基础上添加了一个coordinator.xml
coordinator时区
UTC
GMT
CST ==> GMT+0800 东八区时间
1)将本地服务器的时间设置为GMT+0800
date -R
date
ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
2)
vi /opt/modules/cdh/oozie-4.0.0-cdh5.3.6/conf.oozie.default
<name>oozie.processing.timezone</name>
<value>GMT+0800</value>
3)
oozie-server
oozie-console.jps
177行
改为GMT+0800
coordinator基于数据集的调度
4. oozie bundle
将一些corodinator集中起来
bundle
coordinator
workflow
二、Hue
http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.6/manual.html
hdfs 50070
mapreduce job 8088
oozie 11000/oozie
将上面的页面整合到一个web项目中
hive: hql,在页面上编写hql,同时可以通过点击按钮来执行,并且执行完结果直接展示到页面。
1. 下载
2. 解压
3. 安装依赖包
sudo yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel openldap-devel python-devel sqlite-devel openssl-devel mysql-devel gmp-devel
1)依赖包冲突问题
卸载掉冲突的客户端 rpm -e --nodeps mysql-community-client-5.6.31-2.el6.x86_64
2)
4. 编译安装
在$HUE_HOME下执行
make apps
5. 启动
build/env/bin/supervisor
6. 修改配置文件
1)集成hdfs
webhdfs_url如果是非HA的HDFS:
webhdfs_url=http://beifeng-hadoop-02:50070/webhdfs/v1
webhdfs_url如果是HA的HDFS:
webhdfs_url=http://beifeng-hadoop-02:14000/webhdfs/v1
2)集成yarn
3)集成hive
hue无法连接HiveServer2问题,
4)继承oozie
<property>
<name>oozie.service.WorkflowAppService.system.libpath</name>
<value>/user/oozie/share/lib</value>
<description>
System library path to use for workflow applications.
This path is added to workflow application if their job properties sets
the property 'oozie.use.system.libpath' to true.
</description>
</property>
作业2:
将课上讲过的action
MapReduce aciton: fof
shell action: 日志分割,执行本地shell脚本
hive action: 日志记录数据的清洗和分析
sqooop action:将hive分析结果导出到mysql中
以上所有的workflow通过HUE页面来进行配置,要求有截图。
《OD学oozie》20160813的更多相关文章
-
《OD学Oozie》20160807Oozie
一.引入 MapReduce Job Hive 脚本任务 同一个业务:先后.定时调度 工作流: 定义工作流程 activity jbpm oozie: 大数据工作流定义与调度框架 专门定义与调度Map ...
-
《OD学Hive》第六周20160730
一.Hive的JDBC连接 日志分析结果数据,存储在hive中 <property> <name>hive.server2.thrift.port</name> & ...
-
《OD学hive》第四周0717
一.Hive基本概念.安装部署与初步使用 1. 后续课程 Hive 项目:hadoop hive sqoop flume hbase 电商离线数据分析 CDH Storm:分布式实时计算框架 Spar ...
-
《OD学hadoop》第二周0703
hdfs可视化界面: http://beifeng-hadoop-01:50070/dfshealth.html#tab-overview yarn可视化界面: http://beifeng-hado ...
-
《OD学hadoop》20160903某旅游网项目实战
一.大数据的落地点 1.数据出售 数据商城:以卖数据为公司的核心业务 2. 数据分析 百度统计 友盟 GA IBM analysis 3.搜索引擎 4. 推荐系统 mahout 百分比 5.精准营销 ...
-
《OD学storm》20160827
http://www.cnblogs.com/lujinhong2/p/4686512.html http://blog.csdn.net/paul_wei2008/article/details/2 ...
-
《OD学HBase》20160821
一.HBase性能调优 1. JVM内存调优 MemStore内存空间,设置合理大小 memstore.flush.size 刷写大小 134217728 = 128M memstore.mslab. ...
-
《OD学HBase》20160820
一.案例 微博: 微博内容: 关注用户和粉丝用户: 添加或移除关注用户 查看关注用户的微博内容 微博数据存储: 响应时间 秒级 无延迟 (1)mysql分布式 (2)hbase数据库 使用HBase数 ...
-
《OD学HBase》20160814
一.HBase引入 http://hbase.apache.org/ 大数据的数据库 1. 概述 Hadoop生态系统中的一个分布式.可拓展.面向列.可伸缩,具有自动容错功能的数据库. NoSQL数据 ...
随机推荐
-
UVA - 11987 Almost Union-Find[并查集 删除]
UVA - 11987 Almost Union-Find I hope you know the beautiful Union-Find structure. In this problem, y ...
-
yum提示another app is currently holding the yum lock;waiting for it to exit
Another app 解决方法:rm -rf /var/run/yum.pid 来强行解除锁定,然后你的yum就可以运行了
-
django model 中class meta
class Meta: ordering = ['-num', 'length'] verbose_name = 'name' verbose_name_plural = 'names' orderi ...
-
Spring基础——小的知识点
一.整合多个配置文件 在 Spring Config 文件中,可以使用 <import> 标签将别的配置文件引入到一个文件中,进行配置文件的集成.该标签和 <bean> 标签同 ...
-
js二维码扫描
Cordova 3.x 实用插件(2) -- 二维码Barcode : http://rensanning.iteye.com/blog/2034026 samples-camera: http:// ...
-
POJ 2368 Buttons
题目链接:http://poj.org/problem?id=2368 Bash game (巴什博弈):当K是(L+1)的倍数时可以确保second player赢.所以这道题要找的就是在K的因子中 ...
-
20175314 《Java程序设计》第四周学习总结
20175314 <Java程序设计>第四周学习总结 教材学习内容总结 每个子类只能有一个父类,而一个父类可以有多个子类.可以使用关键字extends来定义一个类的子类:class 子类名 ...
-
linux 再多的running也挡不住锁
再续<linux 3.10 一次softlock排查>,看运行态进程数量之多: crash> mach MACHINE TYPE: x86_64 MEMORY SIZE: GB CP ...
-
回车符与换行符问题——C语言
回车符(carriage return,’\r’)与换行符 (line feed,’\n’) 从上面可以看出换行对应的ASCII码值是10,回车符对应的ASCII码值是13,需要注意的是用户按下回车键 ...
-
android 代码edittext删除或者替换光标处的字串
https://*.com/questions/3609174/android-insert-text-into-edittext-at-current-position Cp ...