python爬虫(二十二) 正则表达式匹配多个字符 - 方木Fengl

时间:2024-03-11 13:03:38

python爬虫(二十二) 正则表达式匹配多个字符

一、1、* :匹配0个或者任意多个字符

text="1234"
ret=re.match(\'\d*\',text)
print(ret.group())
>>1234

2、+:匹配一个或多个字符

 

text="abcd"
ret=re.match(\'\w+\',text)
print(ret.group())
>>abcd

 

3、?:匹配0个或者1个字符

text="abcd"
ret=re.match(\'\w?\',text)
print(ret.group())
>>a

4、{m}:匹配m个字符

text="abcd"
ret=re.match(\'\w{2}\',text)
print(ret.group())
>>ab

5、{m,n}:匹配m到n个字符

text="abcd"
ret=re.match(\'\w{1,5}\',text)  //匹配一个、两个、三个到五个都行
print(ret.group())
>>abcd

二、验证手机号

text="180123456789"
ret=re.match(\'1[34578]\d{9}\',text)
print(ret.group())
>>180123456789

三、验证邮箱

text="2605072149@qq.com"
ret=re.match(\'\w+@[a-z0-9]+\.[a-z]+\',text)
print(ret.group())
>>2605072149@qq.com

四、验证url

text="https://baike.baidu.com/item/Python/407313?fr=aladdin"
ret=re.match(\'(http|https|ftp)://[^\s]+\',text)
print(ret.group())

 

 五、验证身份证

text="311111222222111445"
ret=re.match(\'\d{17}[\dxX]\',text)
print(ret.group())