利用Python正则表达式匹配字符串中的http链接。主要难点是用正则表示出http 链接的模式。
1
2
3
4
5
6
7
8
|
import re
pattern = re. compile (r 'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+' ) # 匹配模式
string = 'Its after 12 noon, do you know where your rooftops are? http://tinyurl.com/NYCRooftops '
url = re.findall(pattern,string)
print url
>>[ 'http://tinyurl.com/NYCRooftops' ]
|
以上这篇Python 正则表达式匹配字符串中的http链接方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/potato012345/article/details/78215754