简单的日志分析流程

时间:2023-01-26 19:48:02

简单的日志分析流程

  1. 使用Flume采集数据到HDFS上
  2. 对数据进行清洗(可以使用MapReduce程序来清洗)
  3. 在Hive上创建相应的表加载清洗后的数据,然后使用Hive对清洗后的数据进行多维分析
  4. 把Hive分析得出的结果通过Sqoop导出到Mysql中
  5. 提供视图工具供用户使用(可以自己写Web程序来访问Mysql)

备注:这边的日志分析最好通过写shell程序结合定时器crontab来完成。不可能每天通过手工来完成日志分析,这样效率太低了。在shell程序中写完整的日志分析流程,然后通过定时器crontab来定时调用该shell程序。