python-re模块常用的函数及方法

时间:2022-05-10 22:37:45

常见的正则表达式属性

  • 仅仅是re模块函数
    compile(patternflags= 0) 使用任何可选的标记来编译正则表达式的模式,然后返回一个正则表达式对象


  • re 模块函数和正则表达式对象的方法 
    match(patternstringflags=0) 尝试使用带有可选的标记的正则表达式的模式来匹配字符串。如果匹配成功,就返回
    匹配对象; 如果失败,就返回
    None
    search(patternstringflags=0) 使用可选标记搜索字符串中第一次出现的正则表达式模式。 如果匹配成功,则返回匹
    配对象; 如果失败,则返回
    None
    findall(patternstring[, flags] ) 查找字符串中所有(非重复)出现的正则表达式模式,并返回一个匹配列表
    finditer(patternstring[, flags] ) findall()函数相同,但返回的不是一个列表,而是一个迭代器。 对于每一次匹配,迭
    代器都返回一个匹配对象
    split(patternstringmax=0) 根据正则表达式的模式分隔符, split函数将字符串分割为列表,然后返回成功匹配的
    列表,分隔最多操作
    max 次(默认分割所有匹配成功的位置)
    sub(patternreplstringcount=0) 使用 repl 替换所有正则表达式的模式在字符串中出现的位置,除非定义 count, 否则就
    将替换所有出现的位置( 另见
    subn()函数,该函数返回替换操作的数目)
    purge() 清除隐式编译的正则表达式模式


  • 常用的匹配对象方法(查看文档以获取更多信息)
    group(num=0) 返回整个匹配对象,或者编号为 num的特定子组
    groups(default=None) 返回一个包含所有匹配子组的元组(如果没有成功匹配,则返回一个空元组)
    groupdict(default=None) 返回一个包含所有匹配的命名子组的字典,所有的子组名称作为字典的键(如果没有
    成功匹配,则返回一个空字典)

  • 常用的模块属性(用于大多数正则表达式函数的标记)
    re.Ire.IGNORECASE 不区分大小写的匹配
    re.Lre.LOCALE 根据所使用的本地语言环境通过\w\W\b\B\s\S实现匹配
    re.Mre.MULTILINE ^$分别匹配目标字符串中行的起始和结尾,而不是严格匹配整个字符串本身的起始
    和结尾
    re.Srer.DOTALL .” (点号)通常匹配除了\n(换行符)之外的所有单个字符;该标记表示“.” (点号)
    能够匹配全部字符
    re.Xre.VERBOSE 通过反斜线转义, 否则所有空格加上#(以及在该行中所有后续文字)都被忽略,除非
    在一个字符类中或者允许注释并且提高可读性