Python中正则表达式的使用

时间:2022-12-03 18:34:31

正则表达式是一种非常强大的工具,是用来对文本(字符串)的匹配,搜索的利器,一门好的语言都不可缺少这一模块,在Python中,re模块就集成了所有正则表达式的功能

关于正则表达式的语法,在这里就不赘述了,本文主要讲一些python中的实例用法:

首先,把re模块中所有的函数和方法在此列举一番:match,search,findall,split.sub,group,groups,compile

1.match(p,s)

一般是两个参数,p:正则表达式(也相当于一个字符串);s:要匹配的字符串

从头开始匹配正则表达式,从p的第一个字符开始匹配,匹配中就输出匹配到的内容,没有就返回None

import re
m = re.match('[a-z]=[0-9]','ssaa=0jinleib=1')   //匹配不到

m = re.match('[a-z]=[0-9]','a=0jinleib=1')   //匹配到'a=0'

2.search(p,s)

跟match的唯一区别就是,它不是从头开始匹配,

import re
m = re.search('[a-z]=[0-9]','ssaa=0jinleib=1')   //匹配到'a=0',但是不会输出b=1,因为它只返回一个匹配到结果

3.group,groups

之所以把这两个函数放在这个位置,是因为你match或者search完之后,想知道自己匹配到的内容是什么,就要用到group,groups。

看上面的例子,m是返回值,它的类型是一个对象,直接输出是看不到结果的,所以就要用到m.group(),或者m.groups()。这样就会输出一个字符串

再说说group和groups的区别:只有正则表达式p中有用'()'括起来的内容,并且匹配成功,用groups才会有结果,要不然都是None,而group都可以用,只不过当正则表达式p中有用'()'括起来的内容时,group会有一个参数,是整数类型,如果是1,就输出p中第1个用'()'括起来的匹配到的内容,以此类推,类似于数组,只不过不是从0开始。

4.findall

参数,和match,search一样,不同的是它返回的是一个列表list,里面含有所有匹配到内容,下面两个例子:

>>>re.findall('car','the car is so carry the barcarid')

['car','car','car']       //匹配到所有的car

import re
m = re.findall('([a-z])=([0-9])','ssaa=0jinleib=1') 

结果:[ ('a','0'), ('b','1') ]      //注意,列表里面的元素已经变成元组了,而元组里面的元素分别是p中两个()括起来的内容,这里就是用()和不用()的区别

5.split

参数还是一样,一个p,一个s。但是要注意一点的是,千万不要和字符串的内建函数(也叫)split混淆!

相信大家对字符串的split函数很熟悉:s='jinlei' s.split('l',s) = [ 'jin', 'ei' ]

这个split的功能是根据正则表达式所能匹配的字符串来分割字符串:

str = '   1.7  2.3 4    123'
alist = re.split(r'\s+',str)
print alist         //猜猜结果是什么?没错[ '','1.7','2.3','4','123' ]。\s表示空格符,以一个或者多个空格为分隔符分割字符串str。

6.sub(p,rep_s,s)

功能:用替代字符串rep_s代替用正则表达式p在目标字符串s上匹配到的内容。

>>>re.sub('X','me','is X')

'is me'       //输出结果

7.compile(p)

一般只是一个参数,它的功能就是编译正则表达式p,它返回一个regex对象

reg = re.compile('d')

reg.match('sd')  //没有匹配到

reg.match('d')   //匹配到d,

返回结果和上面直接用match函数一样,是一个对象,或者None。


好了,有了这些,只要你清楚正则表达式的基本语法,以及在python中一些特殊字符,多加练习,python的正则表达式就能手到擒来啦!!