POSTGRESQL表分区

时间:2022-03-25 01:10:39

最近发现POSTGRESQL的一张表(下面统称为test表)达到67G大小,不得不进行重新分区,下面记录一下步骤:

前言、查看数据表结构(表结构肯定是虚构的)

CREATE TABLE test
(
id integer NOT NULL DEFAULT ,
logday character varying, -- 登录日期
CONSTRAINT test PRIMARY KEY (id)
);

一、正式开始-在dw模式下面创建这个父亲表

CREATE TABLE dw.test
(
id integer NOT NULL DEFAULT ,
logday character varying, -- 登录日期,发现了吧,tmd是字符类型的
CONSTRAINT test PRIMARY KEY (id)
);

二、创建子表,你会发现有CHECK,这就是说2013-06月的继承到子表

--创建子表
CREATE TABLE dw.testl_yy13mm06 ( CHECK ( substring(logday from for ) = '2013-06' )) INHERITS (dw.test);
CREATE TABLE dw.test_yy13mm07 ( CHECK ( substring(logday from for ) = '2013-07' )) INHERITS (dw.test); --创建索引,其实这个索引是建立在dw模式里面的,删除的时候需要执行:DROP INDEX dw.idx_test_yy13mm06,我就吃过这个亏,没加dw模式
CREATE INDEX idx_test_yy13mm06 ON dw.test_yy13mm06 (logday);
CREATE INDEX idx_test_yy13mm07 ON dw.test_yy13mm07 (logday);

三、创建触发器

CREATE OR REPLACE FUNCTION test_insert_trigger()
RETURNS TRIGGER AS
$$
BEGIN
IF(substring(NEW.logday from for ) = '2013-06') THEN
INSERT INTO dw.touch_ticket_channel_yy13mm06 VALUES (NEW.*);
ELSIF (substring(NEW.logday from for ) = '2013-07') THEN
INSERT INTO dw.touch_ticket_channel_yy13mm07 VALUES (NEW.*);
END IF;
RETURN NULL;
END;
$$
LANGUAGE plpgsql ;

四、关联触发器,这样在执行inert语句之前就执行这个触发器了

CREATE TRIGGER test_insert_trigger
BEFORE INSERT ON dw.test
FOR EACH ROW EXECUTE PROCEDURE test_insert_trigger();

五、插入测试数据

insert into dw.test ( SELECT * FROM test);

执行之后就把public模式下面的test表整体迁移到dw模式下的test表里面了

参考:http://www.php100.com/manual/PostgreSQL8/ddl-partitioning.html

续:

我上面犯了一个特别致命的错误,虽然使用函数substring实现了分区,但是查找的时候,没有直接走分区块。比如:SELECT * FROM test WHERE logday = '20174-07-01',所以这条语句需要全表扫描,解决办法:

CHECK substring(NEW.logday from  for ) = '2013-06'

修改为:

CHECK ( logday >= '2013-06-01' AND logday <'2013-07-01' )

当然触发器也要做出一样的调整!~