什么是 System-Versioned Temporal Table?
System-Versioned Temporal Table,暂且容我管它叫版本由系统控制的临时表,它是 SQL Server 2016 中的新型用户表,用于保留完整的数据更改历史记录。 它之所以称为版本由系统控制的临时表,是因为每一行的有效期由数据库引擎管理。
每个临时表有两个显式定义的列,其中每个列都有一个 datetime2 数据类型。每当数据修改后,系统将以独占方式使用这些列来记录每行的有效期。
除了这些列以外,该表还包含对使用镜像架构的另一个历史表的引用。 每当更新或删除了临时表中的某行后,系统将使用历史表来自动存储该行的先前版本。
这个临时表的推出,在一定程度上完全可以替代CDC,可用于ETL,追溯数据,审计等。之前CDC能用到的地方这个会更好用且更易维护。另外,以前约定让程序员更新数据时必须更新UpdateTime之类的约定也完全可以交由系统自己控制了。
创建语法:
CREATE TABLE MyTable
(
Id BIGINT IDENTITY(1,1) NOT NULL PRIMARY KEY
,MyCode CHAR(5)
,MyName NVARCHAR(200)
,RecordStartTime DATETIME2 GENERATED ALWAYS AS ROW START NOT NULL
,RecordEndTime DATETIME2 GENERATED ALWAYS AS ROW END NOT NULL
,PERIOD FOR SYSTEM_TIME(RecordStartTime,RecordEndTime)
)
WITH(SYSTEM_VERSIONING = ON);
建好后,在SSMS中是这个样子的:
由于没有指定历史表的名称,历史表自动被命名为MSSQL_TemporalHistoryFor_前缀再加上原始表的objectID.
删除表时必须先执行关闭表的系统版本开关,否则会报错:
ALTER TABLE MyTable SET (SYSTEM_VERSIONING = OFF)
关闭之后,在SSMS中都成了普通表。
删除之后以给定历史表的名字重建(这里历史表的名字指定时必须指定schema,否则会报错):
CREATE TABLE MyTable
(
Id BIGINT IDENTITY(1,1) NOT NULL PRIMARY KEY
,MyCode CHAR(5)
,MyName NVARCHAR(200)
,RecordStartTime DATETIME2 GENERATED ALWAYS AS ROW START NOT NULL
,RecordEndTime DATETIME2 GENERATED ALWAYS AS ROW END NOT NULL
,PERIOD FOR SYSTEM_TIME(RecordStartTime,RecordEndTime)
)
WITH(SYSTEM_VERSIONING = ON (HISTORY_TABLE = dbo.MyTableHistory));
插入数据:
INSERT INTO [MyTable]([MyCode],[MyName])VALUES('SH001','万剑齐发'),('SH002','ajiangg');
SELECT * FROM [MyTable];
更新/删除数据后的结果:
UPDATE [MyTable] SET MyCode = 'SH003' WHERE ID = 1;
DELETE FROM [MyTable] WHERE ID = 2;
SELECT * FROM [MyTable];
SELECT * FROM [MyTableHistory];
先关闭SYSTEM_VERSIONING,修改历史表名,并再次打开SYSTEM_VERSIONING,即完成了历史表的归档(当然,这样归档的话,归档的那部分数据也就失去了使用FOR SYSTEM_TIME语法查询的能力了):
ALTER TABLE MyTable SET (SYSTEM_VERSIONING = OFF);
EXEC sp_rename 'MyTableHistory', 'MyTableHistory_20170303';
ALTER TABLE MyTable SET (SYSTEM_VERSIONING = ON(HISTORY_TABLE = dbo.MyTableHistory));
追溯历史数据:
SELECT * FROM [MyTable];
SELECT * FROM [MyTableHistory];
SELECT * FROM [MyTable]
FOR SYSTEM_TIME
BETWEEN '2017-03-03 15:43:57.7006650' AND '9999-12-31 23:59:59.9999999'
追溯历史数据查询2(数据存在开始时间小于等于2017-03-03 15:43:57.7006650,且终止时间大于这个时间的Id为2的数据):
关于历史数据的追溯的新条件写法FOR SYSTEM_TIME ****,支持以下几种语法:
表达式 | 符合条件的行 | 说明 |
---|---|---|
AS OF<date_time> | SysStartTime <= date_time AND SysEndTime > date_time | 返回一个表,其行中包含过去指定时间点的实际(当前)值。 在内部,将在临时表及其历史记录表之间进行联合,然后筛选结果以返回在 <date_time> 参数指定的时间点有效的行中的值。 如果 system_start_time_column_name 值小于或等于 <date_time> 参数值,且 system_end_time_column_name 值大于 <date_time> 参数值,则此行的值被视为有效。 |
FROM<start_date_time>TO<end_date_time> | SysStartTime < end_date_time AND SysEndTime > start_date_time | 返回一个表,其中包含在指定的时间范围内保持活动状态的所有行版本的值,不管这些版本是在 FROM 自变量的 <start_date_time> 参数之前开始活动,还是在 TO 自变量的 <end_date_time> 参数值之后停止活动。 在内部,将在临时表及其历史记录表之间进行联合,然后筛选结果,以返回在指定时间范围内任意时间保持活动状态的所有行版本的值。 正好在 FROM 终结点定义的下限时间激活的行将包括在内,正好在 TO 终结点定义的上限时间激活的记录将被排除。 |
BETWEEN<start_date_time>AND<end_date_time> | SysStartTime <= end_date_time AND SysEndTime > start_date_time | 与上面的 FOR SYSTEM_TIME FROM <start_date_time>TO <end_date_time> 描述相同,不过,返回的行表包括在 <end_date_time> 终结点定义的上限时间激活的行。 |
CONTAINED IN (<start_date_time> , <end_date_time>) | SysStartTime >= start_date_time AND SysEndTime <= end_date_time | 返回一个表,其中包含在 CONTAINED IN 参数的两个日期时间值定义的时间范围内打开和关闭的所有行版本的值。 正好在下限时间激活的记录,或者在上限时间停止活动的行将包括在内。 |
ALL | 所有行 | 返回属于当前表和历史记录表的行的联合。 |
创建表时,关于GENERATED ALWAYS AS ROW START/END列还有个HIDDEN选项,这在一些我认为的不规范SQL写法中会有些区别(例如Insert时不指定插入的列,查询数据时使用select *等)
另外,不打开SYSTEM_VERSIONING开关的普通表,也能让GENERATED ALWAYS AS ROW START的标识列自动更新更新时间。(例如如下脚本中创建的表,UpdateTime列会被系统自动更新为最后一次更新的时间)
CREATE TABLE MyTable
(
Id BIGINT IDENTITY(1,1) NOT NULL PRIMARY KEY
,MyCode CHAR(5)
,MyName NVARCHAR(200)
,UpdateTime DATETIME2 GENERATED ALWAYS AS ROW START NOT NULL
,RecordEndTime DATETIME2 GENERATED ALWAYS AS ROW END HIDDEN NOT NULL
,PERIOD FOR SYSTEM_TIME(RecordStartTime,RecordEndTime)
);
好了,关于System-Versioned Temporal Table,就介绍到这啦。