分类: LINUX
摘要: 本文介绍rename命令完成重命名批量文件语法,介绍了rename用到的Perl的替换和转化形式,并给出常用正规表达式。最后给出几个实例。偶尔会遇到需要重命名批量文件,最典型的例子就是数码相机的相片,在Ubuntu可以用工具Purrr或者PerfixSuffix实现该功能,但重命名批量文件并不常用,为了偶尔的一次操作,安装工具(可能通过Ubuntu Software Center或者sudo apt-get install安装),加之图形化界面操作也比较费时间。事实上,rename命令就可以出色完成该工作。 一、rename命令 Linux的 rename 命令有两个版本(C语言和Perl语言),早期的Linux发行版基本上使用的是C语言版本,现在系统几乎都是Perl语言版本了(支持正则处理,功能更强大)[1]。可以通过命令man rename打开rename帮助文档查看版本,如果第一行内容如下,则是Perl语言版本。
- RENAME(1) Perl Programmers Reference Guide RENAME(1)
- rename [ -v ] [ -n ] [ -f ] perlexpr [ files ]
-v(verbose)打印被成功重命名的文件 -n(no-act)只是显示将被重命名的文件,而不重命名(重命名之前可以用-n确认 需要重命名的文件) -f(force)覆盖已经存在的文件 perlexprPerl语言格式的正则表达式 files需要被替换的文件(比如*.c、*.h),如果没给出文件名,将从标准输入读
先举个例子来感受下,比如将当前目录下所有*.nc文件中Sam3替换成Stm32,命令如下:
- rename -n 's/Sam3/Stm32/' *.nc /*确认需要重命名的文件*/
- rename -v 's/Sam3/Stm32/'*.nc /*执行修改,并列出已重命名的文件*/
二、Perl正则表达式 2.1 三种形式[2]
匹配:m/<regexp>/ (可以省略m,直接写成/regexp/) 替换:s/<pattern>/<replacement>/ 转化:tr/<pattern>/<replacement>/博文[3]给出了8种模式,rename命令常用到替换和转化两种(用匹配也没意义)。转换跟替换不同,替换是将replacement整个字符串替换pattern字符串,而转换则是用replacement逐个字符替换pattern逐个字符,结果依赖于replacement与pattern字符个数(见下述分析)。 (1)替换 替换表达方式如下[3],还有一系列参数,貌似不怎么用得着。
- s/PATTERN/REPLACEMENT/egimosx
eEvaluate the right side as an expression. gMatch globally, i.e. all occurrences. iCase-insensitive pattern matching. mTreat string as multiple lines. oOnly compile pattern once, even if variables within it change. sTreat string as single line. xUse extended regular expressions(2)转化 转化有两种等价表达方式,如下:
- tr/SEARCHLIST/REPLACEMENTLIST/cds
- y/SEARCHLIST/REPLACEMENTLIST/cds
cComplement the SEARCHLIST. dDelete found but unreplaced characters. sSquash duplicate replaced characters.转化同替换不同,用REPLACEMENTLIST逐个字符替换SEARCHLIST逐个字符,比如'tr/Sam/Stm/',用S替代S,t替代a,m替代m。结果依赖于两者字符长短,下面以文件名FastSpiSam3C.nc为例进行说明:
- jelline@jelline:~$ rename-n 'tr/Sam3/Stm/' FastSpiSam3C.nc /*替换字符短,用最后一个字符m替换3*/
- FastSpiSam3C.nc renamed as FtstSpiStmmC.nc
- jelline@jelline:~$ rename-n 'tr/Sam3/Stm32/' FastSpiSam3C.nc/*替换字符长,多出字符被忽略*/
- FastSpiSam3C.nc renamed as FtstSpiStm3C.nc
2.2 常用模式 正则表达式中的一些常用模式pattern[2]:
x? 匹配 0 次或一次 x 字符串 x* 匹配 0 次或多次 x 字符串,但匹配可能的最少次数 x+ 匹配 1 次或多次 x 字符串,但匹配可能的最少次数 .* 匹配 0 次或一次的任何字符 .+ 匹配 1 次或多次的任何字符 {m} 匹配刚好是 m 个 的指定字符串 {m,n}匹配在 m个 以上 n个 以下 的指定字符串 {m,} 匹配 m个 以上 的指定字符串 [] 匹配符合 [] 内的字符 [^] 匹配不符合 [] 内的字符 [0-9]匹配所有数字字符 [a-z]匹配所有小写字母字符 [^0-9]匹配所有非数字字符 [^a-z]匹配所有非小写字母字符 ^ 匹配字符开头的字符 $ 匹配字符结尾的字符 \d 匹配一个数字的字符,和 [0-9] 语法一样 \d+ 匹配多个数字字符串,和 [0-9]+ 语法一样 \D 非数字,其他同 \d \D+ 非数字,其他同 \d+ \w 英文字母或数字的字符串,和 [a-zA-Z0-9] 语法一样 \w+ 和 [a-zA-Z0-9]+ 语法一样 \W 非英文字母或数字的字符串,和 [^a-zA-Z0-9] 语法一样 \W+ 和 [^a-zA-Z0-9]+ 语法一样 \s 空格,和 [\n\t\r\f] 语法一样 \s+ 和 [\n\t\r\f]+ 一样 \S 非空格,和 [^\n\t\r\f] 语法一样 \S+ 和 [^\n\t\r\f]+ 语法一样 \b 匹配以英文字母,数字为边界的字符串 \B 匹配不以英文字母,数值为边界的字符串 a|b|c 匹配符合a字符 或是b字符 或是c字符 的字符串 abc 匹配含有 abc 的字符串
三、实例 3.1 将所有*.nc文件中Sam3替换成Stm32
- rename -v 's/Sam3/Stm32/' *.nc /*执行修改,并列出已重命名的文件*/
- rename 's/\.bak$//'*.bak
- rename 'y/A-Z/a-z/'*
- rename 's/[ ]+//g'*
- rename 's/^/jelline/'*
- rename 's/$/jelline/'*