Python使用正则表达式分割字符串

时间:2021-04-04 18:46:01
re.split(pattern, string, [maxsplit], [flags])
  • pattern:表示模式字符串,由要匹配的正则表达式转换而来。
  • string:表示要匹配的字符串。
  • maxsplit:可选参数,表示最大的拆分次数。
  • flags:可选参数表示标志位,用于控制匹配方式,如是否区分子母大小写

示例代码:

import re

pattern = r'[?|&]'                      # 定义分隔符
url = 'http://www.baidu.com/login.jsp?username="wei"&pwd="123"' # 需要拆分的字符串
result = re.split(pattern, url) # 以pattern的值 分割字符串
print(result)

执行结果:
	['http://www.baidu.com/login.jsp', 'username="wei"', 'pwd="123"']

常用标志:

标志 说明
A 或 ASCII 对于\w、\W、\b、\B、\d、\D、\s和\S只进行ASCII匹配(仅适用于Python3.x)
I 或 IGNORECASE 执行不区分子母大小写的匹配
M 或 MULTILINE 将^和$用于包括整个字符串的开始和结尾的每一行(默认情况下,仅适用于整个字符串的开始和结尾处)
S 或 DOTALL 使用(.)字符匹配所有字符,包括换行符
X 或 VERBOSE 忽略模式字符串中未转义的空格和注释