以前对数据库的了解大多数是集中在mysql,最近工作里面一直使用的是oracle,虽然说在互联网行业mysql大行其道,但是一些传统行业或者是金融领域还是更加倾向于使用oracle,sqlserver这种大型数据库。为此还是有必要深入了解以下oracle的一些内部机制的。
有过oracle使用经验的人都知道表空间(tablespace)的概念,表空间其实是一个逻辑概念,它并不实际存在。而与之关系密切的是数据文件(datafile),数据文件是实际存在的,并且和表空间是多对1的关系。其实只知道这些是远远不够的,前段时间遇到一个数据文件超过32G导致的业务问题,才突然醒悟骚年静下心好好学习学习oracle底层的一些概念才是解决问题的王道。首先我们从整体来上了解一下oracle的逻辑体系结构。在这里附上一张百度到的图片。
图片中展示的oracle的最大的逻辑结构为数据库,其实这里最大的体系结构应该是实例(instance),并且实例和数据库是一对一的关系,这样的话我们可以将上图看作是oracle体系结构中的一个可分割的最大单元。 可以看出数据库可划分的最大单元为表空间,而表空间又由段(segment)组成,段由extent构成,如果再往下分的话是block,oracle中block的概念不同于操作系统中块文件的概念,这个我们后面章节解释。下面我们对上述的一些概念进行一下阐述:
表空间:表空间是oracle抽象出来的最大的逻辑单元,用于存储数据库对象。和表空间相关的概念为数据文件,可以通过dba_data_files来查看表空间和数据文件的关系。
表空间分类:
- 永久表空间:存储数据库中需要永久化存储的对象,比如二维表、视图、存储过程、索引。
- 临时表空间:存储数据库的中间执行过程,如:保存order by数据库排序,分组时产生的临时数据。操作完成后存储的内容会被自动释放。临时表空间是通用的,所的用户都使用TEMP作为临时表空间。一般只有tmp一个临时表空间,如果还需要别的临时表空间时,可以自己创建。
- UNDO表空间:保存数据修改前的副本。存储事务所修改的旧址,即被修改之前的数据。当我们对一张表中的数据进行修改的同时会对修改之前的信息进行保存,为了对数据执行回滚、恢复、撤销的操作。
段: 段是指占用数据文件空间的通称,或数据库对象使用的空间的集合;段可以有表段、索引段、回滚段、临时段和高速缓存段等。说到这里有必要提一下表段,因为标段中如果表作为一个分区表,那么表的一个分区占用一个段。
段分类: 由于oracle中段比较多,这里我们只是简单的说一些比较常见的段。
- 表段: 表段,故名思意,它是专门用于存储表的信息的数据结构,通常与索引段联合使用。
- 分区段:这种段类型用于分区,与表段很相似。分区表由一个或多个表分区段组成,组合分区表则由一个或多个表子分区段组成。
- 索引段:这种段类型可以保存索引结构,与mysql类似,在mysql中mysiam存储引擎下索引和数据是分开的,而innodb引擎下是存储在一起的。
- 索引分区: 类似于表分区,这种段类型包含一个索引的某个片。分区索引由一个或多个索引分区段组成。
- 临时段: 用于存放临时数据,比如带有order by语句的sql会在临时段内存储数据。
- 回滚段:回滚段是DBA手动创建的段。Type2 undo段由Oracle自动创建和管理。
- 还有很多其他的段,感兴趣的大家自行研究一哈。
区:区是oracle中由块组成的逻辑单元,在10G中只要创建了表的时候就会分配区,而在11G及其之后是当插入数据的时候才会分配区。区的分配则是动态的,当表的容量超过当前区所能承载的范围时就会自动添加新的区。这个内容可以通过dba_extents表查看。
块: oracle的块是建立在数据库块的基础之上的,通常oracle的块可以是2,4,8,16,32K,是系统块的整数倍,并且定义之后不能被修改。在这里引入一个前段时间遇到的问题: oracle数据文件超过32G导致业务失败的问题。这是因为测试环境上面使用的是smallfile tablespace 模式,所以需要满足以下制约:
由于Oracle的Rowid中使用22位来代表Block号,这22位最多只能代表2^22-1(4194303)个数据块,而在我们一般情况下使用的数据块大小为8k,所以数据文件的理论大小最大为: 31.9999924G,并且在数据文件超过32G的情况下,唯一能做的就是添加一个datafile。