文件名称:hadoop笔记
文件大小:109.66MB
文件格式:ONE
更新时间:2021-11-15 17:10:14
大数据
史上最全hadoop笔记,组件描述 : 1. hdfs : 就是一个文件系统 ,可以存储海量的数据 2. mapreduce : 从海量数据中 ,通过一定的算法 ,计算出有用信息 3. hive : 就是 sql 语句解释器 ,接收用户输入的 sql 语句 ,然后将该 sql 语句翻译成复杂的 mapreduce 程序 ,并发布到 mr 集群中进行运行 ,也是计算出有用的信息 4. hbase : mysql 是基于 linux/windows 的文件系统的数据库 ,而 hbase 就是基于 hdfs 文件系统的数据库 5. flume : 就是一个水泵 ,将水从一个源水坑 ,抽到另一个目的水坑中 ,当然 flume 抽的是 "数据" ,将数据从一个文件中抽取到另一个文件中 6. sqoop : 将 hdfs 文件系统的文件 ,导出到 linux 文件系统的文件中 ,就像 "豌豆荚" 应用程序 ,实现 android 系统和 windows 系统之间的导入和导出 7. ooize/azkaban : 一个完整的业务 ( work ) 是由多个任务 ( task ) 相互配合完成的 ,该组件就是负责协调各个 task 的执行顺序