
1.存储格式
textfile
rcfile
orc
parquet
2.存储方式
按行存储
-》textfile
按列存储
-》parquet
3.压缩比
4.存储textfile的原文件
并加载数据
5.大小
6.保存为textfile,经过mapreduce
7.结果的大小
8.保存为orc格式
9.大小
10.存储为parquet
11.大小
12.使用命令求大小
bin/hdfs dfs -du -s -h /user/hive/warehouse/track_log.db/yhd_par