Ubuntu---regex

时间:2021-01-18 07:05:54

摘要:今天我们学习正则表达式(regex),因为掌握这个是用好 grep 命令的前提条件。

1,位置相关的 patten:

  ^:表示锚定行首,才能匹配。

  $:表示锚定行尾,才能匹配。

  ^$:表示匹配空行,这里的空行表示“回车”,而“空格”或“tab”等都不能算作此处所描述的空行。

  ^abc$:表示 abc 独占一行的时候,才会被匹配到。

  \< 或 \b:匹配单词边界,表示锚定词首,其后面的字符必须作为单词首部出现。

  \> 或 \b:匹配单词边界,表示锚定词尾,其后面的字符必须作为单词首部出现。

  \B:匹配非单词边界,与 \b 相反。

2,连续次数匹配的 patten:

  *:表示前面的字符连续出现任意次,包括0次。

  .:表示任意单个字符(换行符除外)。

  .*:表示任意长度的任意字符,与通配符中的 * 意思相同。

  \?:表示匹配其前面的字符0次或1次。

  \+:表示匹配其前面的字符至少1次,或者连续多次,连续次数没有上限。

  \{n\}:表示前面的字符连续出现n次,将会被匹配到。

  \{x,y\}:表示前面的字符至少连续出现x次,至多连续出现y次,都能被匹配到。

  \{,n\}:表示前面的字符至多连续出现n次,最少0次,都会被匹配到。

  \{n,\}:表示前面的字符至少连续出现n次,才会被匹配到。

3,字符,数字,符号匹配的 patten:

  [ ] :表示匹配指定范围内的任意单个字符

  [^ ]:表示匹配指定范围外的任意单个字符

  [[:alpha:]]:表示任意大小写字母

  [[:lower:]]:表示任意小写字母

  [[:upper:]]:表示任意大写字母

  [[:digit:]]:表示 0 到 9 之间的任意单个数字(包括 0和 9)

  [[:alnum:]]:表示任意数字或字母

  [[:space:]]:表示任意空白字符,包括“空格”、“tab键”等

  [[:punct:]]:表示任意标点符号

  [0-9] 与 [[:digit:]] 等效
  [a-z] 与 [[:lower:]] 等效
  [A-Z] 与 [[:upper:]] 等效
  [a-zA-Z] 与 [[:alpha:]] 等效
  [a-zA-Z0-9] 与 [[:alnum:]] 等效

# 简短格式并非所有正则表达式解析器都可以识别,我们可以使用 -P 选项,表示 grep 使用兼容的 perl 的正则表达式引擎

  \d 表示任意单个0到9的数字
  \D 表示任意单个非数字字符
  \t 表示匹配单个横向制表符(相当于一个tab键)
  \s 表示匹配单个空白字符,包括"空格","tab制表符"等
  \S 表示匹配单个非空白字符  

4,分组与后向引用相关的 patten :

  \(\):表示分组,我们可以将其中的内容当作一个整体,分组可以嵌套

  \(ab\) :表示将 ab 看作一个整体去处理

  \1:表示引用整个正则表达式中第一个分组中匹配到的结果

  \2:表示引用整个正则表达式中第二个分组中匹配到的结果

5,转义符:

  \. : 表示 .

  \\:表示 \   [注意:此时正则表达式要用单引号('regex//'),不能用(“regex//”)]

$ grep 'a\\' regex 

参考博客:http://www.zsythink.net/

相关文章