【转】关于python中re模块split方法的使用

时间:2021-01-23 22:35:17

注:最近在研究文本处理,需要用到正则切割文本,所以收索到了这篇文章,很有用,谢谢原作者。

原址:http://blog.sciencenet.cn/blog-314114-775285.html

关于python中re模块split方法的使用
已有 3094 次阅读 2014-3-12 11:30 |系统分类:科研笔记

今天在写一段小代码的时候需要用到re.split()方法,在使用的过程中发现了一个以前不知道的新用法,发现这个用法还是挺实用的,就把它记录下来:

>>> m = re.split( ‘\d+’ , ’dkjj23jjjj44’)

>>>m

[‘dkjj’ , ‘jjjj’ , ‘’ ]

>>> m = re.split( ‘(\d+)’ , ’dkjj23jjjj44’)             #匹配部分加上()

>>>m

[‘dkjj’ , ‘23’ , ‘jjjj’ , ‘44’ , ‘’ ]

>>> m = re.split( ‘\d+’ , ’dkjj23jjjj44as’)            #匹配部分加上了()

>>>m

[‘dkjj’ , ‘jjjj’ , ‘as’ ]

>>> m = re.split( ‘(\d+)’ , ’dkjj23jjjj44as’)

>>>m

[‘dkjj’ , ‘23’ , ‘jjjj’ , ‘44’ , ‘as’ ]

在匹配部分加上()之后所切出的结果是不同的,没有()的没有保留所匹配的项,但是有()的却能够保留了匹配的项,这个在某些需要保留匹配部分的使用过程是非常重要的。