【Sed简介】
sed是一个文件处理工具,本身是一个管道命令,主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。sed以行为单位,一次处理一行内容,处理时,把当前处理的行存储在临时缓冲区(模式空间),接着用sed命令处理缓冲区里的内容,处理完成后,把缓冲区里的内容送到屏幕,然后接着处理下一行,这样不断重复,直到文件末尾。其实文件内容并没有改变,除非使用了重定向输出。
【定位】
用数字来定位所编辑的行,用逗号分隔的行数表示起止范围,比如1,5表示1,2,3,4,5行,美元符号$表示最后一行。范围可以通过数据、正则表达式或二者结合的方式确定。
【使用】
调用sed命令有两种形式:
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)
注:sed脚本是一个sed的命令清单,启动sed时以-f选项引导脚本文件名。sed脚本中,命令的末尾不能有任何空白或文本,如果在一行中有多个命令,要用分号分隔。以#开头的为注释行,且不能跨行。
常用选项:
-n 使用silent模式。在一般sed用法中,所有来自STDIN的资料一般都会被列出到屏幕上,但加上-n参数后,则只有经过sed特殊处理的那行才会被列出。
-e 直接在指令列模式上进行sed的动作编辑。
-f 直接将sed的动作写在一个文件里,-f scriptfile则可以执行scriptfile内的sed动作。
-r sed的动作支援的是延伸型正规表示法的语法。
-i 直接修改读取的文件内容,而不是由屏幕输出。
常用命令:
a 在当前行后面加入一行文本。
c 取代,c的后面可以接字符串,这些字符串可以取代n1,n2之间的行。
d 删除。D是删除模板块的第一行。
i 插入,i后面可以接字符串,而且这些字符串会在新的一行出现(目前的上一行)。
p 打印。通常与-n一起用。P是打印模板块的第一行。
s 取代,可以直接进行取代的工作,可以搭配正则表达式。
= 打印当前行号。
! 表示后面的命令对所有没有选定的行发生作用。
r file 从file中读行。
w file 写并追加模板块到file末尾。W file是写并追加模板块的第一行到file末尾。
s /re/string 用string替换正则表达式re。
n 读取下一个输入行,用下一个命令处理新的行。
替换标记:
g 行内全面替换。
p 打印行。
w 把行写入一个文件。
x 互换模板块中的文本和缓冲区中的文本。
y 把一个字符翻译为另外的字符。(不用于正则表达式。)
元字符集:
^ 锚定行的开始。如/^some/匹配所有以some开头的行。
$ 锚定行的结束。如/some$/匹配所有以some结尾的行。
. 匹配一个非换行符的字符。如/s.d/匹配s后接任意一个字符,然后是d。
* 匹配零或多个字符。如/*some/匹配所有模板是一个或多个空格后紧跟some的行。
[] 匹配一个指定范围内的字符。如/[Ss]ome/匹配Some和some。
[^] 匹配一个不在指定范围内的字符。如/[^A-GO-T]es/匹配不包含A-G和O-T的一个字母开头,紧跟es的行。
& 保存搜索字符用来替换其它字符。如s/love/**&**/,love这成**love**。
\(..\) 保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。
\< 锚定单词的开始。如/\<love/匹配包含以love开头的单词的行。
\> 锚定单词的结束。如/able\>/匹配包含以able结尾的单词的行。
x\{m\} 重复字符x,m次。如/A\{5\}/匹配包含5个A的行。
x\{m,n\} 重复字符x至少m次,至多n次。如/A\{5,10\}/匹配5至10个A的行。
【例子】
显示:n命令
sed -n '/\$/p' filename 查询包括关键字$所在的所有行(使用反斜线屏蔽特殊含义)。
删除:d命令
sed '2d' filename 删除filename文件的第2行
sed '$d' filename 删除filename文件的最后一行
sed '2,$d' filename 删除filename文件的第2行到末尾所有行
sed '/some/'d filename 删除filename文件中所有包含some的行
增加命令:a命令
sed '1,3a hello world' filename 在第一行到第三行后面增加字符串hello world。
sed '1a hello\n world' filename 在第一行后增加多行,使用换行符\n。
sed '/^some/a\\hello' filename hello被追加到以some开头的行后面。sed要求命令a后面有一个反斜杠。
插入命令:i命令
sed -i '$a bye' filename 在filename中最后一行直接输入bye。
sed '/some/i\\a new line' filename 如果some被匹配,则把反斜杠后面的文本插入到匹配行的前面。
代替:c命令
sed '1,2c hello' filename 将第一行到第二行代替为hello
替换:s命令
sed -n '/hello/p' filenme | sed 's/hello/hi/g' 将filename中的hello替换为hi。
sed -n '/hello/p' filename | sed 's/hello//g' 将filename中的hello删除。
sed 's/some/someone/g' filename 在整行范围内把some替换为someone。如果不加g标识,则只有每行第一个匹配的some被替换成someone
sed -n 's/^some/someone/p' filename -n选项和p标识一起使用,表示只打印那些发生替换的行,也就是说,如果某行开头的some被替换成someone,就打印该行。sed -n 's/^some/someone/gp' filename是如果某行的some被替换成someone,就打印该行。
sed 's/^192.168.0.1/&localhost/' filename 所有以192.168.0.1开头的行都会被替换成它自己加localhost,变成192.168.0.1localhost。
sed -n 's/\(love\)able/\1rs/p' filename love被标记为1,所有loveable会被替换成lovers,而且替换的行会被打印出来。
sed 's#10#100#g' filename 不论什么字符,紧跟着s命令的都被认为是新的分隔符,所以,#在这里是分隔符,代替了默认的/分隔符。表示把所有10替换成100。
选定的范围:逗号
sed -n '/one/,/two/p' filename 所有在模板one和two所确定的范围内的行都被打印。
sed -n '5,/^some/p' filename 打印从第5行开始到第一个包含以some开头的行之间的所有行。
sed '/one/,/two/s/$/some/' filename 对于模板one和two之间的行,每行的末尾用字符串some替换。
多点编辑:e命令
sed -e '1,5d' -e 's/some/someone/' filename -e选项允许在同一行里执行多条命令。第一条命令删除1至5行,第二条命令用some替换someone。命令的执行顺序对结果有影响。如果两个命令都是替换命令,那么第一个替换命令将影响第二个替换命令的结果。
sed --expression='s/some/someone/' --expression='/love/d' filename 一个比-e更好的命令是--expression,它能给sed表达式赋值。
从文件读入:r命令
sed '/some/r file' filename file里的内容被读进来,显示在与some匹配的行后面,如果匹配多行,则file的内容将显示在所有匹配行的下面。
写入文件:w命令
sed -n '/some/w file' filename 在filename中所有包含some的行都被写入file里,并且会覆盖file的内容。
下一个:n命令
sed '/some/{ n; s/aa/bb/; }' filename 如果some被匹配,则移动到匹配行的下一行,把这一行的aa替换成bb,并打印该行,然后继续。
变形:y命令
sed '1,10y/abc/ABC/' filename 把1到10行内所有的abc转换为大写。注意,正则表达式元字符不能使用这个命令。
退出:q命令
sed '10q' filename 打印完第10行后退出sed。
保持和获取:h命令和G命令
sed -e '/some/h' -e '$G' filename 在sed处理文件的时候,每一行都被保存在一个叫做模式空间的临时缓冲区中,除非行被删除或者输出被取消,否则所有被处理的行都将打印在屏幕上。接着模式空间被清空,并存入新的一行等待处理。在这个例子里,匹配some的行被找到后,将存入模式空间,h命令将其复制并存入一个成为保持缓存区的特殊缓冲区内。第二条语句的意思是,当到达最后一行后,G命令去除保持缓存区的行,然后把它放回模式空间中,且追加到现在已经存在于模式空间中的行的末尾。在这个例子中就是追加到最后一行。简单来说,任何包含some的行都被复制并追加到该文件的末尾。
保持和互换:h命令和x命令
sed -e '/some/h' -e '/someone/x' filename 互换模式空间和保持缓冲区内容。也就是把包含some和someone的行互换。
【注意】
在sed命令里引用shell变量要使用双引号。
例:根据name变量的内容来删除named.conf文件中zone段的脚本
name='zone\ "localhost"'
sed "/$name/,/}:/d" named.conf
【参考资料】
SED单行脚本快速参考 http://sed.sourceforge.net/sed1line_zh-CN.html