Linux grep正则表达式

时间:2022-02-27 00:48:37

    grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包 括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。

grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。

grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。

正则表达式分类

基本正则表达式    (Basic Regular Expression )  BREs
扩展正则表达式    (Extend Regular Expression ) EREs
perl的正则表达式  (Perl Regular Expression ) P

格式

grep  [options]  pattern [file…]

选项和参数 (比较常用的选项,了解更多使用man grep 查看)

--color=auto-n                            加上相对应的行号-v  --invert-match 反向选取-o  --only-matching 只显示被模式匹配到的字串 ,而不是整个行-i   --ignore-case      忽略大小写-l   --files-with-matches 只列出匹配的文件名-L  --files-without-matches 只列出不匹配的文件名-w  --word-regexp 匹配完整字符串(单词)-A  Number 显示匹配到的行 并显示其后面的Number行-B   Number 显示匹配到的行 并显示其前面的Number行-C   Number           ……               显示前后面的Number行-E   --extended-regexp  支持扩展正则表达式


元字符:

^:锚定行首的符合条件的内容,用法格式“^grep”;$:锚定行尾的符合条件的内容,用法格式“grep$”;.:匹配任意单个字符;*:匹配紧挨在其前面的字符任意次;.*:匹配任意长度的任意字符;[]:匹配包含内的任一字单个字符;[^]:匹配包含外的任一字单个字符;\:将下一字符标记为特殊字符、文本、反向引用或八进制转义符;\?:匹配紧挨在其前面的字符0次或1次;\<:锚定词首\>:锚定词尾x\{m\}:匹配其前面的字符“x”m次(精确匹配);x\{m,\}:匹配其前面的字符“x”至少m次;x\{m,n\}:匹配其前面的字符“x”至少m次,至多n次;\(\):分组;


字符集合:

[:lower:]:代表小写字母,即 a-z[:upper:]:代表大写字母,即 A-Z[:digit:]:代表数字,即 0-9[:alpha:]:代表任何英文大小写字母,即 a-z A-Z[:alnum:]:代表英文大小字符及数字,即 0-9 a-z A-Z[:space:]:代表空格键与Tab按键[:punct:]:代表标点符号,即 “  , ;? ! : # $


grep及正则表达式实例

1. 在/etc/paswd文件查找匹配root的串 并以高亮显示其匹配的字符串

Linux grep正则表达式


2.  在/etc/passwd文件中查找以root开头的行 并将其显示

Linux grep正则表达式

通过行其锚定进行匹配 此次匹配的内容仅是以root开头的行 在其他位置出现的不匹配


3. 在/etc/passwd文件中查找以/bin/bash结尾的行 并将其显示

Linux grep正则表达式


4. 在/etc/passwd文件中查找bin的字符串和锚定后bin字符串的比较

Linux grep正则表达式


锚定后  


Linux grep正则表达式

通过锚定/< />进行字符串完全匹配 如果不适用锚定符 将会有/sbin类似的字符串一起出来


5.在/etc/passwd文件中查找匹配俩个bin之间包含的任意字符的行

Linux grep正则表达式

该查找以bin为分组进行匹配 命令中\1 表示引用第一个分组的内容 如果字符串中有多个分组

可以用\2\3进行引用第二分组及第三分组中的字符串

6.在/etc/passwd文件中查找匹配o 并至少出现2次的字符串的行

Linux grep正则表达式

匹配前面字符至少2次 至少出现2次或者更多次 比如 rooot 也会一起出现的


7.在/etc/fstab文件中以#开头 且后面跟一个或者多个空白字符 而后又跟任意非空白字符的行

Linux grep正则表达式


8. 显示/etc/fstab文件中的内容 并不显示以#开头和空白行

Linux grep正则表达式


简单介绍到这里  后续更新 如不足之处 请多多提议