概述
Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。
分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库 管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但 是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。
使用分区表条件
- 表的大小超过2GB。
- 表中包含历史数据,新的数据被增加都新的分区中。
使用分区表优势
- 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。
- 增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;
- 维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;
- 均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。
表分区类型
1.范围分区
范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。
当使用范围分区时,请考虑以下几个规则:
1) 每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
2) 所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。
3) 在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。
例1:假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码:
A>按Int类型分区
CREATE TABLE CUSTOMER
(
CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
FIRST_NAME VARCHAR2() NOT NULL,
LAST_NAME VARCHAR2() NOT NULL,
PHONE VARCHAR2() NOT NULL,
EMAIL VARCHAR2(),
STATUS CHAR()
)
PARTITION BY RANGE (CUSTOMER_ID)
(
PARTITION CUS_PART1 VALUES LESS THAN () ,
PARTITION CUS_PART2 VALUES LESS THAN () ,
PARTITION CUS_PART3 VALUES LESS THAN (MAXVALUE)
)
B>按时间分区
CREATE TABLE ORDER_ACTIVITIES
(
ORDER_ID NUMBER() NOT NULL,
ORDER_DATE DATE,
TOTAL_AMOUNT NUMBER,
CUSTOTMER_ID NUMBER(),
PAID CHAR()
) PARTITION BY RANGE (ORDER_DATE)
(
PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) ,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) ,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (MAXVALUE)
)
2.列表分区
该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。
CREATE TABLE ListTable
(
id INT PRIMARY KEY ,
name VARCHAR (20),
area VARCHAR (10)
)
PARTITION BY LIST (area)
(
PARTITION part1 VALUES ('guangdong','beijing') TABLESPACE Part1_tb,
PARTITION part2 VALUES ('shanghai','nanjing') TABLESPACE Part2_tb
);
)
3.散列分区
这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。
CREATE TABLE HASH_TABLE
(
COL NUMBER(),
INF VARCHAR2()
)
PARTITION BY HASH (COL)
(
PARTITION PART01 TABLESPACE HASH_TS01,
PARTITION PART02 TABLESPACE HASH_TS02,
PARTITION PART03 TABLESPACE HASH_TS03
)
--或者
CREATE TABLE emp
(
empno NUMBER (4),
ename VARCHAR2 (30),
sal NUMBER
)
PARTITION BY HASH (empno) PARTITIONS 8
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);
4.组合范围散列分区
这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。
CREATE TABLE SALES
(
PRODUCT_ID VARCHAR2(),
SALES_DATE DATE,
SALES_COST NUMBER(),
STATUS VARCHAR2()
)
PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)
( PARTITION P1 VALUES LESS THAN(TO_DATE('2016-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009
(
SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
),
PARTITION P2 VALUES LESS THAN (TO_DATE('2017-01-01','YYYY-MM-DD')) TABLESPACE rptfact2009
(
SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
)
)
5.复合范围散列分区
这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。
create table dinya_test
(
transaction_id number primary key,
item_id number() not null,
item_description varchar2(),
transaction_date date
)
partition by range(transaction_date)subpartition by hash(transaction_id) subpartitions store in (dinya_space01,dinya_space02,dinya_space03)
(
partition part_01 values less than(to_date(‘--’,’yyyy-mm-dd’)),
partition part_02 values less than(to_date(‘--’,’yyyy-mm-dd’)),
partition part_03 values less than(maxvalue)
);
表分区维护性操作
1、添加分区(add)
以下代码给SALES表添加了一个P3分区
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意:以上添加的分区界限应该高于最后一个分区界限。
以下代码给SALES表的P3分区添加了一个P3SUB1子分区
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');
2、删除分区(drop)
以下代码删除了P3表分区:
ALTER TABLE SALES DROP PARTITION P3;
在以下代码删除了P4SUB1子分区:
ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。
3、合并分区(merge)
合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:
ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;
4、拆分分区(split)
拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。
ALTER TABLE SALES SPLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
5、重命名表分区(rename)
以下代码将P21更改为P2
ALTER TABLE SALES RENAME PARTITION P21 TO P2;
6、相关操作
跨分区查询
select sum( *) from
(select count(*) cn from t_table_SS PARTITION (P200709_1)
union all
select count(*) cn from t_table_SS PARTITION (P200709_2)
);
删除分区表语法
DROP TABLE TableName PURGE;
(如果删除表误使用了Drop Table tablename,删除的表会放到表回收站中,可采用 purge recyclebin;清理分区中的表,详细可参考该Oracle表回收站删除 )
显示当前用户所有分区表的详细分区信息
select * from USER_TAB_PARTITIONS
显示当前用户所有分区表的信息
select * from USER_PART_TABLES
普表转分区表的方式
非分区表转换分区的方式很多,这里主要记录通过交换分区(Partition exchange method),实现非分区表和分区表的转换。
1、交换分区的操作步骤
- 创建分区表,假设有2个分区,P1,P2;
- 创建表A存放P1规则的数据;
- 创建表B 存放P2规则的数据;
- 用表A 和P1 分区交换。 把表A的数据放到到P1分区;
- 用表B 和p2 分区交换。 把表B的数据存放到P2分区;
2、SQL脚本流程
原非分区表
create table p_dba_temp
(
id number,time date
)
创建分区表(和原表的数据结构、索引以及主外键一直)
create table p_dba
(
id number,time date
)
partition by range(time)
(
partition p1 values less than (to_date('2016-09-1', 'yyyy-mm-dd')),
partition p2 values less than (to_date('2017-11-1', 'yyyy-mm-dd'))
);
交换分区数据
alter table p_dba exchange partition P1 with table p_dba_temp ---including indexes without VALIDATION -- 交换表数据与分区数据
alter table p_dba exchange partition P1 with table p_dba_temp including indexes without VALIDATION -- 交换表数据与分区数据和索引 select * from dba_indexes where Table_Name='TABLENAME' ----查询表的索引,表名称大写 rename tabble rename table tablename to tablenewname;--修改表名称
3、分区表交换遇到问题记录
1、执行语句遇到问题:ORA-02266: 表中的唯一/主键被启用的外部关键字引用
原因:分区表中的主键被别的表引用,因此执行交换前必须先把该主键disable及引用该主键的外键disable,同时交换表中的主键也必须disable掉与分区表保持一致。
alter table partiton_tablename disable primary key cascade; --对分区表即交换表的主键及引用该主键的外键disable
alter table change_tablename disable primary key cascade; --加上cascade后引用该主键的外键也会disable -----启用
alter table partiton_tablename enable primary key
alter table change_tablename enable primary key
注:由于将主键disable了,因此交换后记得将主键及引用该主键的外键enable。
参考
1、分区表的分区与普通表交换的一些问题(http://www.cnblogs.com/lanzi/archive/2013/01/24/2875838.html)