收缩数据库文件

时间:2021-01-31 22:24:24

数据库使用数据文件(扩展名是mdf 或 ndf)来存储数据,使用日志文件(扩展名是ldf)来存储事务日志,通常情况下,数据文件会持续增长,不会自动释放空闲空间,这样会导致硬盘空间耗尽。如果一个数据库的文件有很多空闲空间,收缩数据库文件是一种解决硬盘空间紧张的直接方式。在SQL Server中,我们可以使用 DBCC ShrinkFile命令收缩数据文件,该命令首先将文件尾部的区(extent)移动到文件的开头,文件结尾的空闲的硬盘空间被释放给操作系统,这种操作就像截断将文件的尾部一样,这种方式不需要消耗很多IO就能释放空间;但是,如果空闲部分不在文件末尾时,收缩操作必须扫描数据文件,并对正在读取的页面加锁,把文件末尾的区移动到文件开头,这是一个IO密集型的操作,影响数据库的性能,但是,收缩操作不是一个独占行为,在做文件收缩时,其他用户仍然可以对数据库进行读写操作。在任意一个时间点停止dbcc shrinkfile命令,任何已经完成的工作都将保留。

一,收缩文件命令

收缩文件(DBCC SHRINKFILE)命令做的收缩都是区一级的动作,它会把使用过的区向文件前面移动,把没有使用的区从文件中移除。但是,它不会把一个区里面的空闲页面(Empty Page)移除、也不会把页面中的空闲空间移除。因此,如果一个数据库文件中含有很多只使用了一两个页面的区,收缩操作的效果会不明显。收缩文件不会丢失数据,如果数据最少占用1GB空间,那么收缩操作不会把文件收缩到少于1GB。

收缩文件命令的语法:

DBCC SHRINKFILE ( { file_name | file_id } { [ , EMPTYFILE ] 
    | [ [ , target_size ] [ , { NOTRUNCATE | TRUNCATEONLY } ] ] } )

收缩文件是一个函数,其参数的含义是:

  • target_size :单位是MB,收缩操作的目标是把文件收缩到target_size指定的大小。收缩操作是把文件末尾的区向文件开头移动,这意味着,文件末尾的已使用的区会被移动到文件的前面,先重新分配可用的硬盘空间,在移动数据之后,释放数据原来占用的空间。
  • EMPTYFILE  :清空文件,把数据从当前文件迁移到同一个文件组中的他文件上,同时禁止数据存储到空文件中,被清空的文件被移除。
  • NOTRUNCATE :不截断选项,该选项的作用是把已分配(allocated)的区从文件末尾移动到文件前面的未分配的(unallocated )区中,由于文件末尾未的空闲空间并没有释放到操作系统,因此文件的大小不变。
  • TRUNCATEONLY :仅截断选项,该选项的作用是把文件末尾的空闲空间释放给操作系统,由于该选项不会做任何区的移动操作,因此,该选项不会消耗硬盘IO,操作的结果是数据文件的大小减少。在截断日志文件时,该选项不移动任何日志记录,仅仅从日志文件的末尾移除不活动的虚拟日志文件(VLF)。

二,收缩文件的步骤

通常情况下,收缩数据库的数据文件和日志文件, 释放文件中的空闲空间,需要两个步骤:先移动,后释放

Step1,将文件的后部分中正在使用的区向前移动,移动到文件的前部分:

dbcc shrinkfile('filename',0,notruncate)

Step2,将文件末尾未被使用的区释放掉,归还给操作系统

dbcc shrinkfile('filename',target_size_MB,truncateonly)

清空文件,是为了把空文件从数据库中移除:

-- Empty the data file.
DBCC SHRINKFILE (Test1data, EMPTYFILE);
GO
-- Remove the data file from the database.
ALTER DATABASE AdventureWorks2012
REMOVE FILE Test1data;
GO

三,日志文件的收缩

事务日志文件不停增长的原因有很多,比如

  • 1,Recovery Mode 不是simple,或者说不处于auto-truncate 模式下,
  • 2,有一个很大的事务在运行,
  • 3,有一个运行很长时间的事务没有提交

都会导致事务日志文件不停增长,此时执行dbcc shrinkflie 命令是不能把日志文件shrink的,必须针对特定的情况,采取对应的对策,一般来说,

  • 对于1,必须安排backup log的计划,使事务日志文件截断和重用 ,
  • 对于2,优化语句的业务逻辑,避免出现大的事务,
  • 对于3,优化application,及时commit 或 rollback 事务。

有时,会遇到日志文件无法清空的异常:

 

dbcc shrinkfile('db_log',emptyfile)

 

 

四,收缩操作的副作用

收缩数据文件是IO密集型的操作,需要IO,CPU和内存资源,并会产生大量的事务日志,并会导致索引碎片,因此,尽量避免收缩数据文件,只有当迫不得已时,才适当收缩数据文件。由于数据文件的增长也是非常耗时的,所以,不要把数据文件收缩得太小,要预留足够的空间,避免数据文件出现增长的情况。

1,影响Range操作的查询性能

Shrink file 有可能产生大量的碎片,这是因为shrink file 存在Extent的移动,逻辑上连续的extent,在移动之后,可能会导致物理上不再连续,影响Range 操作的性能。

2,消耗IO和CPU资源

如果SQL Server在shrink data file时不移动数据,那么shrink 就不会产生碎片,对现有数据不会有影响。唯一不影响现有物理数据的情况是在执行DBCC Shrinkfile 命令时指定TruncateOnly选项,DBCC Shrink命令只将文件末尾的剩余空间释放,归还给OS。

Shrinkfile 是个非常消耗IO资源的操作,Shrinkfile的过程需要移动大量的数据,消耗大量的IO;Shrinkfile的过程会被记录到日志,造成日志暴涨;还会消耗大量的CPU资源。

3,产生大量的日志,影响依赖日志的Application的性能

收缩产生的大量日志会被事务日志传送,镜像,复制等操作重复执行。

4,ShrinkFile 不能将Data File 收缩的太小

当插入新的数据时,如果Data File空间不够,那么SQL Server需要重新申请 Disk Space,增加 Data file Size,在此过程中,SQL Server需要对新分配的Disk Space填0初始化,除非你开启的是不用填零初始化的选项,不用填零初始化有泄露信息的风险。在全部空间初始化完成之前,新分配的Data File是不能使用的。这个填0初始化,是个非常耗费IO资源的操作,如果一次增长的空间过大,SQL Server需要很长时间对新分配的Disk Space进行初始化,这可能会导致Application timeout,使事务回滚,影响Application的性能。

 

参考文档:

DBCC SHRINKFILE (Transact-SQL)

Why you want to be restrictive with shrink of database files