053 关于hive的存储格式

时间:2023-03-08 16:17:18
053 关于hive的存储格式

1.存储格式

  textfile

  rcfile

  orc

  parquet

2.存储方式

  按行存储

    -》textfile

  按列存储

    -》parquet

3.压缩比

  053 关于hive的存储格式

4.存储textfile的原文件

  053 关于hive的存储格式

  并加载数据

  

5.大小

  053 关于hive的存储格式

6.保存为textfile,经过mapreduce

  053 关于hive的存储格式

7.结果的大小

  053 关于hive的存储格式

8.保存为orc格式

  053 关于hive的存储格式

9.大小

  053 关于hive的存储格式

10.存储为parquet

  053 关于hive的存储格式

11.大小

  053 关于hive的存储格式

12.使用命令求大小

   bin/hdfs dfs -du -s -h /user/hive/warehouse/track_log.db/yhd_par

  053 关于hive的存储格式