re模块 正则表达式

时间:2022-12-15 15:56:42

1、表示字符

re模块 正则表达式

2、原始字符串

Python中字符串前面加上 r 表示原生字符串

与大多数编程语言相同,正则表达式里使用"\"作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。

Python里的原生字符串很好地解决了这个问题,有了原始字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。

3、表示数量

re模块 正则表达式

4、表示边界

re模块 正则表达式

5、匹配分组

re模块 正则表达式

6、

re.match函数

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。

re模块 正则表达式

7、

 

re.search方法

re.search 扫描整个字符串并返回第一个成功的匹配。

函数语法:

re.search(pattern, string, flags=0)
re模块 正则表达式

re.match与re.search的区别

re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。



8、

检索和替换

Python 的re模块提供了re.sub用于替换字符串中的匹配项。

语法:

re模块 正则表达式


9、

compile 函数

compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。

语法格式为:

re模块 正则表达式

10、

findall

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

注意: match 和 search 是匹配一次 findall 匹配所有。

语法格式为:

findall(string[, pos[, endpos]])
re模块 正则表达式

11、

re.split

split 方法按照能够匹配的子串将字符串分割后返回列表,它的使用形式如下:

re模块 正则表达式