第14章 基于Hadoop的数据仓库Hive

时间:2019-05-17 10:31:26
【文件属性】:

文件名称:第14章 基于Hadoop的数据仓库Hive

文件大小:1.13MB

文件格式:PDF

更新时间:2019-05-17 10:31:26

Hadoop, Hive

本章首先介绍了数据仓库的概念、Hive的基本特征、与其他组件之间的关系、与传统数据库的区别以及它在企业中的具体应用;接着详细介绍了Hive的系统架构,包括基本组成模块、工作原理和几种外部访问方式,描述了Hive的具体应用及Hive HA原理;同时,介绍了新一代开源大数据分析引擎Impala及其与Hive的比较分析;最后,以单词统计为例,介绍了如何使用Hive进行简单编程,并说明了Hive编程相对于MapReduce编程的优势。


网友评论