re模块\正则表达式
一、元字符
1、. ^ $ * + ? { } [ ] | ( ) \
"." 代表(任意一个字符)
"*" 代表(任意数量任意字符,0-无穷)
"+" 代表(任意一个或无数字符,1-无穷)
"?" 代表(0或1个字符)
"^" 代表(字符串开头)
"$" 代表(字符串结尾)
"{}" 代表(指定次数)
2、转义符 \
1)、反斜杠后边跟元字符去除特殊功能,比如\.
2)、反斜杠后边跟普通字符实现特殊功能,比如\d
\d 匹配任何十进制数; 它相当于类 [0-9]。
\D 匹配任何非数字字符; 它相当于类 [^0-9]。
\s 匹配任何空白字符; 它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符; 它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符; 它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符; 它相当于类 [^a-zA-Z0-9_]
\b 匹配一个特殊字符边界,比如空格 ,&,#等
3、分组 ()
ret = re.findall("(yuan)+","lalal11yuanhao22yuanyuanhaohao33yuan") #分组(),用findall命令返回的是分组内容
print(ret) #['yuan', 'yuan', 'yuan']