python re 正则匹配 split sub

import re

编译：

motif=‘([ST])Q’

seq="SQAAAATQ"

regrex=re.compile(motif) #编译成正则对象

regrex=re.compile(motif,re.IGNORECASE) #编译成正则对象,忽略大小写

匹配：

sea=regrex..search(seq) #返回第一次的匹配对象

mat=regrex.match(seq)#从序列开始位置寻找正则匹配对象

all=regrex.findall(seq)#返回包含所有匹配的子字符串表

ier=regrx.finditer(seq)#返回所有匹配对象的迭代器

for i in iter:

print i.group() #group()返回匹配对象字符串内容

print i.group(1) #返回匹配到的子组

print i.span() #返回匹配对象的包含对象的元组

print i.start() #返回匹配对象的起始位置

print i.end() #返回匹配对象的终止位置

匹配到后修改字符串

1.split字符串

separator=re.compile('\|')

anno=''A|B|C"

col=separator.split(anno)

2.替换内容

new=separator.sub("@",anno) # sub(r,s,[c]) 将s中匹配到的前c个'|'替换成@，默认全部替换

sublist=separator.subn("@",anno) #subn(r,s,[c]) 返回元组（新的字符串，替代的数量）

秒客网