Hive入门学习随笔(一)

时间:2024-06-19 14:35:26

Hive入门学习随笔(一)

===什么是Hive?

它可以来保存我们的数据,Hive的数据仓库与传统意义上的数据仓库还有区别。

Hive跟传统方式是不一样的,Hive是建立在Hadoop HDFS基础之上的据仓库基础框架。也就是说

--Hive这个数据仓库中的数据是保存在HDFS上。

--Hive可以用ETL的方式来进行数据提取转化加载。

--Hive定义了简单的类似SQL查询语言,称为HQL。

--Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理內建的mapper和reducer无法完成的复杂的分析工作。

--Hive是SQL解析引擎,它将SQL语句转移成M/R Job,然后在Hadoop上执行。把执行的结果最终反映给用户。

--Hive的表其实就是HDFS的目录,Hive的数据其实就是HDFS的文件