python爬虫(二十二) 正则表达式匹配多个字符
一、1、* :匹配0个或者任意多个字符
text="1234" ret=re.match(\'\d*\',text) print(ret.group()) >>1234
2、+:匹配一个或多个字符
text="abcd" ret=re.match(\'\w+\',text) print(ret.group()) >>abcd
3、?:匹配0个或者1个字符
text="abcd" ret=re.match(\'\w?\',text) print(ret.group()) >>a
4、{m}:匹配m个字符
text="abcd" ret=re.match(\'\w{2}\',text) print(ret.group()) >>ab
5、{m,n}:匹配m到n个字符
text="abcd" ret=re.match(\'\w{1,5}\',text) //匹配一个、两个、三个到五个都行 print(ret.group()) >>abcd
二、验证手机号
text="180123456789" ret=re.match(\'1[34578]\d{9}\',text) print(ret.group())
>>180123456789
三、验证邮箱
text="2605072149@qq.com" ret=re.match(\'\w+@[a-z0-9]+\.[a-z]+\',text) print(ret.group())
>>2605072149@qq.com
四、验证url
text="https://baike.baidu.com/item/Python/407313?fr=aladdin" ret=re.match(\'(http|https|ftp)://[^\s]+\',text) print(ret.group())
五、验证身份证
text="311111222222111445" ret=re.match(\'\d{17}[\dxX]\',text) print(ret.group())