
import re
编译:
motif=‘([ST])Q’
seq="SQAAAATQ"
regrex=re.compile(motif) #编译成正则对象
regrex=re.compile(motif,re.IGNORECASE) #编译成正则对象,忽略大小写
匹配:
sea=regrex..search(seq) #返回第一次的匹配对象
mat=regrex.match(seq)#从序列开始位置寻找正则匹配对象
all=regrex.findall(seq)#返回包含所有匹配的子字符串表
ier=regrx.finditer(seq)#返回所有匹配对象的迭代器
for i in iter:
print i.group() #group()返回匹配对象字符串内容
print i.group(1) #返回匹配到的子组
print i.span() #返回匹配对象的包含对象的元组
print i.start() #返回匹配对象的起始位置
print i.end() #返回匹配对象的终止位置
匹配到后修改字符串
1.split字符串
separator=re.compile('\|')
anno=''A|B|C"
col=separator.split(anno)
2.替换内容
new=separator.sub("@",anno) # sub(r,s,[c]) 将s中匹配到的前c个'|'替换成@,默认全部替换
sublist=separator.subn("@",anno) #subn(r,s,[c]) 返回元组 (新的字符串,替代的数量)