正则表达式学习进程(一)re.match()

时间:2022-06-12 22:38:06
#正则表达式学习笔记 import re

""" .匹配任意字符 除换行符 {n}精确匹配前面n个表达式 \s 匹配任意的空白字符 \w 匹配字母数字及下划线 .* 匹配任意除换行符之外的字符 {n} 精确匹配n个前面表达式。 + 匹配1个或多个的表达式。 ( ) 匹配括号内的表达式 ? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式 re.S 如果不使用re.S参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始,不会跨行 """  #re.match() 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()返回none  #用法:re.match(pattern,string ,flags=0) flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。 """ 1.string与pattern完全相同,成功匹配 2.string虽然多出一个字母,但pattern匹配完成时,匹配成功,后面的字符不再匹配。 3.string匹配到最后一个字母时,发现仍然无法完全匹配,匹配失败。  """ content ='Hello 123 4567 World_This is a Regex Demo' contents ='Hello 123 4567 World_This is a Regex Demo ada' result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo$', content)
print(result)
print(type(result))#<class '_sre.SRE_Match'> print(len(content))
print(result.group())#返回匹配结果 Hello 123 4567 World_This is a Regex Demo print(result.span())#输出范围 (0,41) result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo', contents)
print(result)  #结果:<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>  #泛匹配 result =  re.match('Hello.*Demo$',content)
print(result)  #<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'> print(result.group())  #Hello 123 4567 World_This is a Regex Demo  #匹配目标 content ='Hello 1234567 World_This is a Regex Demo' result = re.match('Hello\s(\d+)\sWorld.*Demo$',content)
#匹配括号里面的 print("############")
print(result.group())
print(result.group(1)) #1234567 print(result.span())   #(0,40)  #贪婪匹配 result = re.match('He.*(\d+).*Demo$',content)
print(result.group())
print(result.group(1)) #输出7 前面的1-6被.*匹配,贪婪模式  #非贪婪模式 result1 = re.match('He.*?(\d+).*Demo$',content)
result2 = re.match('He.*?(\d+).*?Demo$',content)
print(result2.group(1)) # print(result1.group(1)) #输出1234567    #匹配模式 content = """Hello 1234567 World_This is a Regex Demo """ result1 = re.match('^He.*?(\d+).*?Demo$', content)
print(result1) #输出None 因为有换行符 result2 = re.match('^He.*?(\d+).*?Demo$', content,re.S)
print(result2) #输出None print(result2.group(1))#1234567  #转义  content = 'price is $5.00' result = re.match('price is $5.00',content)
print(result) #None result = re.match('price is \$5\.00', content)
print(result)#<_sre.SRE_Match object; span=(0, 14), match='price is $5.00'>  """ 总结:尽量使用泛匹配,使用()得到匹配目标,尽量使用非贪婪模式、有换行符就用re.S """