《shell 脚本攻略》--正则表达式的使用

时间:2020-12-10 21:26:07

    首先看一下正则表达式的组成部分:

《shell 脚本攻略》--正则表达式的使用

为了匹配给定文本中的所有单词,可以使用下面的正则表达式:

(?【a-zA-Z】+?)"?"用于匹配单词前后可能出现的空格。[a-z][A-Z]+代表一个或多个字母(a~z和A~Z)

为了匹配一个IP地址,可以使用下面的正则表达式:

[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}

    处理特殊字符:

    正则表达式$、^、.、*、+、{}等作为特殊字符。

    对于正则表达式:[a-z]*.[0-9]

    它可以匹配0个或多个[a-z]([a-z]*),接任意单个字符(.),再接[0-9]中的任意一个字符,所以能够匹配abcd09。

经常使用的正则表达式举例

^ 行首

$ 行尾

^ [ t h e ] 以t h e开头行

[ S s ] i g n a [ l L ] 匹配单词s i g n a l、s i g n a L、S i g n a l、S i g n a L

[Ss]igna[lL]". 同上,但加一句点

[ m a y M A Y ] 包含m a y大写或小写字母的行

^ U S E R $ 只包含U S E R的行

[tty]$ 以t t y结尾的行

" . 带句点的行

^ d . . x . . x . . x 对用户、用户组及其他用户组成员有可执行权限的目录

^ [ ^ l ] 排除关联目录的目录列表

^[^d] ls –l | grep ^[^d] 只显示非文件夹的文件

[ . * 0 ] 0之前或之后加任意字符

[ 0 0 0 * ] 0 0 0或更多个

[ iI] 大写或小写I

[ i I ] [ n N ] 大写或小写i或n

[ ^ $ ] 空行

[ ^ . * $ ] 匹配行中任意字符串

^ . . . . . . $ 包括6个字符的行

[a- zA-Z] 任意单字符

[ a - z ] [ a - z ] * 至少一个小写字母

[ ^ 0 - 9 " $ ] 非数字或美元标识

[ ^ 0 - 0 A - Z a - z ] 非数字或字母

[ 1 2 3 ] 1到3中一个数字

[ D d ] e v i c e 单词d e v i c e或D e v i c e

D e . . c e 前两个字母为D e,后跟两个任意字符,最后为c e

" ^ q 以^ q开始行

^ . $ 仅有一个字符的行

^".[0-9][0-9] 以一个句点和两个数字开始的行

' " D e v i c e " ' 单词d e v i c e

D e [ V v ] i c e " . 单词D e v i c e或d e v i c e

[ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 4 " } 对日期格式d d - m m - y y y y

[ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } I P地址格式

[ ^ . * $ ] 匹配任意行

[A-Za-z]* 匹配所有单词

常用的g r e p选项-c 只输出匹配行的计数。-i 不区分大小写(只适用于单字符)。-h 查询多文件时不显示文件名。-l 查询多文件时只输出包含匹配字符的文件名。-n 显示匹配行及行号。-s 不显示不存在或无匹配文本的错误信息。-v 显示不包含匹配文本的所有行。例子grep -v "Sort" tab2     显示不包含匹配文本的所有行grep -n "Sort" tab2     显示匹配行及行号grep -c "Sort" tab2     只输出匹配行的计数精确匹配: grep "01">" tab2grep -in "code" tab2    忽略大小写多次过滤grep -in "code" tab2 | grep "02"