Linux下文件的打包、解压缩指令——tar,gzip,bzip2

时间:2022-03-16 19:59:34

  本文是对 鸟叔的Linux私房菜(基础学习篇) 第三版 的学习笔记,原文可参考原书中文网站 鸟叔的Linux私房菜。更多详细信息可直接参考对应Linux命令的 man 帮助( 如 man tar)。

  在Linux环境下,对于文件的操作更多通过命令行指令而不是单纯的鼠标点击,而文件管理中一个重要的操作便是压缩和加压操作。通过文件的压缩和解压,可以使得文件占用更少的存储空间,也可以让文件传输更加便捷。本文主要介绍Linux下常用的打包指令和解压缩指令,并介绍不同的压缩文件拓展名的区别。

 

文件后缀的含义

  随着压缩技术的发展,Linux环境下提供的压缩指令和格式开始变多。为了便于用户区分不同压缩文件使用的不同压缩技术,进而使用合适的指令进行操作,一般使用后缀标识文件在压缩或打包过程中所使用的压缩技术。常见的后缀有以下几种:

  

*.Z           //    compress程序压缩产生的文件(现在很少使用)
*.gz          //    gzip程序压缩产生的文件
*.bz2         //    bzip2程序压缩产生的文件
*.zip     //   zip压缩文件
*.tar // tar程序打包产生的文件 *.tar.gz // 由tar程序打包并由gzip程序压缩产生的文件 *.tar.bz2 // 由tar程序打包并由bzip2程序压缩产生的文件

  从后缀可以看出,gzip、bzip2、tar指令是在打包和压缩过程中较为常用的指令。

 

压缩命令——gzip、bzip2

  gzip

  gzip可以压缩产生后缀为 .gz 的压缩文件,也可以用于解压gzip、compress等程序压缩产生的文件。不带任何选项和参数使用gzip或只带有参数 - 时,gzip从标准输入读取输入,并在标准输出输出压缩结果。

  gzip的常用指令选项如下:  

基础格式: gzip [Options] file1 file2 file3
指令选项:(默认功能为压缩)
-c       //将输出写至标准输出,并保持原文件不变
-d       //进行解压操作
-v       //输出压缩/解压的文件名和压缩比等信息
-digit     //digit部分为数字(1-9),代表压缩速度,digit越小,则压缩速度越快,但压缩效果越差,digit越大,则压缩速度越慢,压缩效果越好。默认为6.

  注意,使用 gzip 指令压缩/解压文件均会使得源文件消失,即源文件会被直接解压/压缩而不保留备份。若想要保留原文件可以使用 -c 参数结合数据流重定向操作(见下例)。

  gzip exp1.txt exp2.txt     //分别将exp1.txt和exp2.txt压缩,且不保留原文件。注意对于多个文件参数是将多个文件分别进行压缩,而不是压缩在一起。参考下文 tar 指令。

  gzip -dv exp1.gz       //将exp1.gz解压,并显示压缩比等信息。

  gzip -cd exp1.gz > exp.1    //将exp1.gz解压的结果放置在文件exp.1中,并且原压缩文件exp1.gz不会消失

  特别注意第三条实例, -d 指示解压缩,-c 参数是将结果输出至标准输出,通过 > 符号,将原本输出至标准输出的解压结果重定向至exp.1中,既解压了文件,原压缩文件也没有消失。

  注:对应于 gzip,可以使用 gunzip 进行解压操作,效果类似gzip -d xx,同时可以使用zcat读取压缩文件的内容并显示在标准输出,功能类似于 gzip -c xx.

  bzip2

  bzip2是采用更好压缩算法的压缩程序,一般可以提供较之gzip更好的压缩效果。其具有与gzip相似的指令选项,压缩产生 .bz2 后缀的压缩文件。

  bzip2的常用指令选项如下:

基础格式: bzip2 [Options] file1 file2 file3 指令选项:(默认功能为压缩) -c       //将输出写至标准输出
-d       //进行解压操作
-v       //输出压缩/解压的文件名和压缩比等信息 -k       //在压缩/解压过程中保留原文件
-digit     //digit部分为数字(1-9),代表压缩速度,digit越小,则压缩速度越快,但压缩效果越差,digit越大,则压缩速度越慢,压缩效果越好。默认为6.

  

  bzip2 exp1.txt exp2.txt       //分别将exp1.txt和exp2.txt压缩,且不保留原文件。

  bzip2 -dv exp1.bz2       //将exp1.bz2解压,并显示压缩比等信息。

  bzip2 -kd exp1.bz2         //将exp1.bz2解压,并且原压缩文件exp1.bz2不会消失

  注:对应于 bzip2,可以使用 bunzip2 进行解压操作,效果类似bunzip2 -d xx,同时可以使用bzcat读取压缩文件的内容并显示在标准输出,功能类似于 bzip2 -c xx.

 

打包指令——tar

  上文已经提到,gzip 或 bzip2 带有多个文件作为参数时,执行的操作是将各个文件独立压缩,而不是将其放在一起进行压缩。这样就无法产生类似于Windows环境下的文件夹打包压缩的效果。(gzip与bzip2也可以使用文件夹作为参数,使用 -f 选项,但也是将其中的每个文件独立压缩)。为了实现打包压缩的效果,可以使用命令 tar 进行文件的打包操作(archive),再进行压缩。

  tar 指令可以将文件打包成文件档案(archive)存储在磁盘/磁带中,打包操作一般伴随压缩操作,也可以使用 tar 指令对打包压缩后的文件解压。

  tar 常用命令参数如下:

  

基本格式:tar [Options] file_archive  //注意tar的第一参数必须为命令选项,即不能直接接待处理文件
常用命令参数:
//指定tar进行的操作,以下三个选项不能出现在同一条命令中
-c        //创建一个新的打包文件(archive)
-x        //对打包文件(archive)进行解压操作
-t        //查看打包文件(archive)的内容,主要是构成打包文件(archive)的文件名

//指定支持的压缩/解压方式,操作取决于前面的参数,若为创建(-c),则进行压缩,若为解压(-x),则进行解压,不加下列参数时,则为单纯的打包操作
-z        //使用gzip进行压缩/解压,一般使用.tar.gz后缀
-j        //使用bzip2进行压缩/解压,一般使用.tar.bz2后缀

//指定tar指令使用的文件,若没有压缩操作,则以.tar作为后缀
-f filename   //-f后面接操作使用的文件,用空格隔开,且中间不能有其他参数,推荐放在参数集最后或单独作为参数
         //文件作用取决于前面的参数,若为创建(-c),则-f后为创建的文件的名字(路径),若为(-x/t),则-f后为待解压/查看的打包压缩文件名

//其他辅助选项
-v        //详细显示正在处理的文件名
-C Dir      //将解压文件放置在 -C 指定的目录下
-p(小写)     //保留文件的权限和属性,在备份文件时较有用
-P(大写)     //保留原文件的绝对路径,即不会拿掉文件路径开始的根目录
--exclude=file //排除不进行打包的文件

  常见的tar指令操作如下:

 压缩: 

 tar -cvjpf etc.tar.bz2 /etc  //-c为创建一个打包文件,相应的-f后面接创建的文件的名称,使用了.tar.bz2后缀,-j标志使用bzip2压缩,最后面为具体的操作对象/etc目录
 
 查看:
 tar -tvjf etc.tar.bz2     //-t为查看操作,则-f对应所查看的文件的名称,文件后缀显示使用bzip2进行压缩,所以加入-j选项,-v会显示详细的权限信息

 解压
 tar -xvjf etc.tar.bz2     //-x为解压操作,则-f指定的是解压使用的文件,文件后缀显示使用bzip2进行压缩,所以加入-j选项,即使用bzip2解压
                   //若只解压指定打包文件中的一个文件,在上述指令的最后加上带解压文件名作为参数即可

  注意:使用tar打包的文件会保存原有的文件路径,并默认取出了所有成员文件路径的根目录,如下图

  Linux下文件的打包、解压缩指令——tar,gzip,bzip2

  这样做的目的在于,当用户在某一目录如/home/haha目录下进行解压操作时,tar会将解压出来的文件路径与当前目录拼接,即为 /home/haha/etc/emacs,从而将文件解压在当前目录下。(如果还有印象,目录名也可以使用 -C 选项指定)但若是打包压缩时不取出文件路径的根目录,则会按照存储的绝对路径如/etc/emacs解压文件,可能将/etc文件下的相应文件覆盖掉,当然在进行备份和恢复时该操作是有效的。tar提供 -P选项来保留文件路径的根目录。

 

zip文件相关命令 -- unzip

  unzip 命令与之前的 tar 指令类似,具有对 zip 文件进行查看、测试和解压的功能。

基本格式:unzip [Options] file[.zip]    //不接任何Options时,默认将指定的file文件解压至当前文件夹,可同时接受多个文件参数
常用命令参数: //压缩文件内容查看
-Z        //以形如 ls -l 的格式显示目标文件内容,实际原理是命令第一个参数为-Z时,其余参数会被视为 zipinfo 的参数,并产生对应效果 
-Z1        //仅显示压缩文件内容的文件名,更多显示可查看 zipinfo 命令的 man 帮助
-l        //显示压缩文件中包括时间、占用空间和文件名等信息,内容上较 -Z 更简单

//文件测试
-t        //在内存中解压文件并进行文件的完整性校验(CRC校验)

//解压缩参数,注意unzip默认即为解压操作
-f        //注意与 tar 命令不同,unzip指定 -f 参数时,则将磁盘上已经存在且内容新于对应磁盘文件的压缩内容解压出来
-n        //
解压缩时不覆盖已存在的文件(而是跳过)
-q        //安静模式,仅解压缩而不输出详细信息
-d dir      //将文件解压至dir指定的文件夹中

  可以使用unzip命令对zip文件进行相关的操作。

  (1)查看压缩文件的所有文件名(注意 -Z 选项表示之后所有的参数被视为 zipinfo 的参数并输出相应结果) -> unzip -Z1 file.zip

  (2)测试文件的完整性 -> unzip -t file.zip

  (3)将文件解压至当前用户的主目录 -> unzip  -q file.zip  -d ~