sed的N;P用法
原文地址
这里介绍的是sed的一个多行模式的使用,一开始对sed中命令N的用法不是很理解,经过多次尝试,通过几个例子对N的用法进行总结:
N即Next,它同n(next)的区别是:N命令将下一行追加到模式空间中,不打印模式空间的值,而使用n是打印当前模式空间的内容,并且读取下一行
蒙受启发
> cat num
1
2
3
4
5
6
7
8
9
> sed ’N;$!D’ num
8
9
>
执行过程详解:
首先解释重要的几个命令的用途:
D删除模板块的第一行 并返回脚本头部执行
$ 锚定行的结束 如:/sed$/匹配所有以sed结尾的行 ,继续执行
! 表示后面的命令对所有没有被选定的行发生作用。
大概说一下:
N;$!D
首先读入第一行: 1 (注:这不是N命令读入的)
执行N,读入第2行,追加到1后面,成了1\n2;
$!D,不是最后一行,所以执行D,模式空间由1\n2成了2, 控制流返回脚本第一条命令,即N。这样一直执行
….
直到执行N读入第9行:9,这里模式空间为:8\n9
$!D,因为是最后一行,所以不执行D,控制流到达脚本底部,输出模式空间的内容:
8
9
上面这段例子摘自网络,给了我很大启发,另外测试如下:
关于N:
append the next line of input into the pattern space. 这是sed用户手册当中说的,很明显,意思是将当前读入行的下一行读取到当前的模式空间。
关于P:
Print up to the first embedded newline of the current pattern space.打印当前模式空间中的第一块。
关于D:
Delete up to the first embedded newline in the pattern space. Start next cycle, but skip reading from the input if there is still data in the pattern space.
删除当前模式空间的第一块,重新开始下一次循环,这个在后面例子中给予验证:
各种验证
验证一:NP结合
> cat num
1
2
3
4
> sed ’N;P’ num
1
1
2
3
3
4
> sed ’N;p’ num
1
2
1
2
3
4
3
4
对于上面的结果给予解释:P用于打印当前模式空间的第一块,而p打印整个当前模式空间。所以当使用P的时候,步骤如下:首先sed默认的读取1,模式空间为1,让你后执行N,模式空间变成1\n2\n,然后执行P,也就是打印1\n;当前行的处理,打印模式空间也就是1\n2\n;这时sed再从文件中读取下一行,也就到了3\n,执行N;模式空间变成了3\n4\n;
执行P;打印3\n;继续执行当前行的处理,打印模式空间3\n4\n;sed再从文件中读取下一行,发现没有了,结束处理流程。对于小p,和d大P的区别了解的话也就不难理解了。
验证二:ND结合
> cat num
1
2
3
4
> sed ’N;D’ num
4
> sed ’N;d’ num
>
对于D;删除当前模式空间第一块,并且返回命令开始继续执行。上述结果解释如下:
首先sed读取一行1\n;执行到N;模式空间为1\n2\n;执行D;模式空间变为:2\n;跳到前面继续执行N;模式空间变为2\n3\n;执行D;模式空间变为:3\n;跳回继续执行N;模式空间变为:3\n4\n;接着执行D;模式空间变为:4\n;跳回执行N的时候发现没有了下一行,所以跳出循环,接着sed继续处理,打印4\n;sed继续再读取文件的时候没有数据,所以结束处理。
验证3:NpD,再验证
> cat num
1
2
3
4
> sed ’N;p;D’ num
1
2
2
3
3
4
4
首先,sed读取一行,执行到N;模式空间为:1\n2\n;执行p;打印1\n2\n;执行D;模式空间变为:2\n;跳回执行N;模式空间变为:2\n3\n;执行p;打印2\n3\n;执行D;模式空间变为:3\n;跳回执行N;模式空间变为:3\n4\n;执行p;打印3\n4\n;执行D;模式空间变为:4\n;跳回执行N;没有数据。跳出循环,sed继续处理,默认打印模式空间所有数据4\n; 因此只有1打印一遍,其余行都打印2遍。
另外d和大D的区别了解以后也就明白了。
总结体会:sed处理始终在一个模式空间中进行,而且对于待处理文件,N读取了文件中的一行后,sed继续处理的时候应该是接着去读取,这里我理解是sed读取文件和N读取文件这些的共用一个指针。
在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,除非行被删除或者输出被取消,否则所有被处理的行都将 打印在屏幕上。接着模式空间被清空,并存入新的一行等待处理。
常用命令:
利用sed给每行添加行号。
> cat passwd
uucp:x:10:14:Unix-to-Unix CoPy system:/etc/uucp:/bin/bash
mqq:x:1000:100::/usr/local/app:/bin/bash
mysql:x:1001:1001::/home/mysql:/bin/bash
natpan:x:1002:100::/data/natpan:/bin/bash
nagios:x:1003:100::/home/nagios:/bin/bash
nagios:x:1003:100::/home/nagios:/bin/bash
nagios:x:1003:100::/home/nagios:/bin/bash
给每行加上行号,命令如下:
> sed = passwd | sed ’N;s/\n/: /g’
1: uucp:x:10:14:Unix-to-Unix CoPy system:/etc/uucp:/bin/bash
2:
3: mqq:x:1000:100::/usr/local/app:/bin/bash
4: mysql:x:1001:1001::/home/mysql:/bin/bash
5: natpan:x:1002:100::/data/natpan:/bin/bash
6: nagios:x:1003:100::/home/nagios:/bin/bash
7: nagios:x:1003:100::/home/nagios:/bin/bash
8: nagios:x:1003:100::/home/nagios:/bin/bash
mqq@wsd_207_62_sles10sp1:~/alenzhou/shell_test/sed>
空行不打印行号,做一下匹配就行
> sed ’/./=’ passwd | sed ’/./N;s/\n/: /g’
1: uucp:x:10:14:Unix-to-Unix CoPy system:/etc/uucp:/bin/bash
3: mqq:x:1000:100::/usr/local/app:/bin/bash
4: mysql:x:1001:1001::/home/mysql:/bin/bash
5: natpan:x:1002:100::/data/natpan:/bin/bash
6: nagios:x:1003:100::/home/nagios:/bin/bash
7: nagios:x:1003:100::/home/nagios:/bin/bash
8: nagios:x:1003:100::/home/nagios:/bin/bash