什么是全量表,增量表,快照表,拉链表?

时间:2024-03-09 20:17:30
第一次听说这几个词汇 认真查了下资料再加自己的理解整理如下:
全量表:1.无分区(也就相当于只1个分区),以下都以天来计算,表中的数据是前面一天的所有数据;
    2.比如今天12号,全量表就有11号的所有数据;
    3.是最新的一天数据,会覆盖10号的所有数据,无历史数据;
    4.用途:所有报表
快照表:1.每天一个分区,一般以时间以天分区;
    2.比如今天12号,20200612号分区里的数据是历史到11号的所有数据,以此类推;
    3.数据量大的时候,浪费空间;
    4.用途:未知
增量表:1.每天一个分区,记录每天新增的数据;
    2.计算公式:增量表(20200612)=快照表(20200613)-快照表(20200612)
    //难点:因为快照表(20200613)记录的是12日及以前的数据;
    3.用途:日报-常用、月报
拉链表:1.也是分区表,是一种维护历史状态,以及最新状态数据的一种表;
    2.当前记录存的是当前时间之前的所有历史记录的最后变化量(总量);
    3.分区字段一般为开始时间start_date和结束时间end_date;
    4.存量是在某一时刻的总量;
    5.用途:月报-常用、日报
 
资料来源:https://blog.csdn.net/a6822342/article/details/100050548,
https://www.cnblogs.com/wqbin/p/10223988.html