Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理。
1. 版本表
i) VERSION -- 查询版本信息
2. 数据库、文件存储相关
i) DBS -- 存储Hive中所有数据库的基本信息
ii) SDS -- 存储Hive中文件存储的基本信息
3. 表、视图相关
i) TBLS -- 存储Hive表、视图、索引表的基本信息
简要说明:1. 内部表与外部表的区别, 外部表 drop table 后,只删除元数据信息,数据文件还在。但是内部表 drop table 后,元数据和数据文件都会删除。
2. INDEX_TABLE : 创建索引后,Hive会单独生成一个物理表,存储索引信息和数据。
4. 列、分区相关
i) COLUMNS_V2 -- 存储表对应的字段信息
ii) PARTITIONS -- 存储表分区的基本信息
iii) PARTITION_KEYS -- 存储分区的字段信息