具体代码如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
|
#coding=utf8
from urllib import request
import re
import urllib,os
url = 'http://tieba.baidu.com/p/3840085725'
def get_image(url):
#获取页面源码
page = urllib.request.urlopen(url)
html = page.read()
#解码,否则报错
html = html.decode( 'utf8' )
#正则匹配获取()的内容
reg = r 'src="(https.+?.[jpg,png])"'
imge = re. compile (reg)
# 获取正则匹配的数据,"(.+?.jpg)" 的数据,返回一个list
imglist = imge.findall(html)
return imglist
def save_img(imglist):
dir = os.path.join(os.path.dirname(__file__), 'img' )
i = 1
for img in imglist:
#python3格式化字符串的另一种写法
imgpath = f '{dir}\\image{i}.jpg'
try :
#urlretrieve下载图片并保存到本地
urllib.request.urlretrieve(img,imgpath)
i + = 1
print (u '图片开始下载' )
except Exception:
print (f 'image:{img}下载失败' )
continue
imglist = get_image(url)
save_img(imglist)
|
总结
以上所述是小编给大家介绍的python3 爬取图片的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://blog.csdn.net/qq_35958094/article/details/83790686