oracle分区技术提高查询效率

时间:2023-02-12 19:24:59

概述:

当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。

下面介绍如何使用分区增加查询效率

range分区:就是区域分区

CREATE TABLE SALE
(
PRODUCT_ID VARCHAR2(5),
SALE_COUNT NUMBER(10,2)
)
PARTITION BY RANGE (SALE_COUNT)
(
PARTITION P1 VALUES LESS THAN (1000) TABLESPACE CUS_TS01,
PARTITION P2 VALUES LESS THAN (2000) TABLESPACE CUS_TS02
)

查看分区语法:

  select * from user_tab_partitions;  --查询所有分区情况,可以接条件where table_name='sale'查看分区表结构

  select * from sale partition(p1);  --查询某表的某一分区数据

分区后,新增数据的SALE_COUNT字段如果小于1000就存储到P1分区中,如果1000到2000存储到P2分区中。

但是这时如果我们新增的一条数据的SALE_COUNT字段值大于2000,将无法存储到表中。

我们可以扩展分区,语法如下:

  alter table sale add partition p4 values less than(maxvalue); --大于2000的都会存到此分区中,当然也可以增加更多的分区

同时可以删除分区,语法如下:

  alter table sale drop partition p4; --注意:删除分区会把分区内已有的数据同时删除

但还存在一个问题,如果现在update分区p1中的SALE_COUNT值为1500,是不会成功的,需要在update前增加以下语句:

  alter table sale enable row movement; --使其row能移动

这样再update就可以成功了

分区索引

分区之后虽然可以提高查询的效率,但也仅仅是提高了数据的范围,所以我们在有必要的情况下,需要建立分区索引,从而进一步提高效率。

分区索引大体上分为两大类,一类叫做local,一类叫做global。

local:在每个分区上建立索引(一般采用这种方式)

global:一种在全局上建立索引,这种方式分不分区都一样,一般不使用

下面进行语法演示:

注意:分区上建立的索引一定是分区字段

create index idx_count on sale(sale_count) local;--建立分区索引,在sale表的每个分区都建立了索引

select * from user_ind_partitions;--查询所有分区索引情况

全局索引global写法就是把上面的local替换成global,但不会使用

有些时候,如果你分区分为0~1000,1000~2000,这时如果说0~1500这个范围内的数据会被频繁查询,1500之后查询很少,那么就可以使用这种自定义的全局索引方式对0~1500建立索引,之后的设置maxvalue即可,语法与分区语法相似

global自定义全局索引方式(前缀索引):

create index idxname on table(field) global

  partition by range(field) 

  (

    partition p1 values less than(value),  .......

    partition pN values less than(maxvalue)

  );

其他分区介绍

1.hash分区

hash分区实现均匀的负载值分配,增加hash分区可以重新分布数据,简单理解就是分区直接平均分配

CREATE TABLE SALE
(
PRODUCT_ID VARCHAR2(5),
SALE_COUNT NUMBER(10,2)
)
PARTITION BY HASH (PRODUCT_ID)
(
PARTITION P1,
PARTITION P2
)

2.list分区

该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。

CREATE  TABLE  ListTable
(
id INT PRIMARY KEY ,
name VARCHAR (20),
area VARCHAR (10)
)
PARTITION BY LIST (area)
(
PARTITION part1 VALUES ('guangdong','beijing') TABLESPACE Part1_tb,
PARTITION part2 VALUES ('shanghai','nanjing') TABLESPACE Part2_tb
);

3.复合分区(用的不多)

create table student(
sno number,
sname varchar2(10)
)
partition by range (sno)
subpartition by hash (sname)
subpartitions 4
(
partition p1 values less than(1000),
partition p2 values less than(2000),
partition p3 values less than(maxvalue)
);

复合分区首先大体上分为三个分区p1,p2,p3,然后每一个分区内部再进行hash分区,分为4份

查询子分区的语句:select * from user_tab_subpartitions where table_name='student';

4.间隔分区(工作中常用)

是一种分区自动化的分区,可以指定时间间隔进行分区,这是oracle11g的新特性,实际工作中很常用。实际上是由range分区引申的,最终实现了range分区的自动化

create table interval_sale
(sid int,sdate timestamp)
partition by range(sdate)
interval (numtoyminterval(1,'MONTH'))
(
partition p1 values less than (TIMESTAMP '2017-11-12 00:00:00.00')
)

指定时间之前建立一个分区,之后每隔一个月建立一个分区

问题:如果我们drop掉了表,那么这个表的分区还存在吗?

答案是存在的,oracle提供了很强大的数据恢复功能,有一个类似回收站的机制,删除表后,分区以特殊的形式仍然存在user_tab_partitions中,使用purge recyclebin语法后,会清空回收站,使用flashback table 表名 to before drop语句可以恢复删除的表。