超简单的scrapy实现ip动态代理与更换ip的方法实现

简单实现ip代理，为了不卖广告，
请自行准备一个ip代理的平台
例如我用的这个平台,每次提取10个ip

从上面可以看到数据格式是文本，换行是\r\n，访问链接之后大概就是长这样的,scrapy里面的ip需要加上前缀http://
例如:http://117.95.41.21:34854

超简单的scrapy实现ip动态代理与更换ip的方法实现

OK，那现在已经准备好了ip了，先给你们屡一下思路。

ip池和计数器放在setting文件

第一次请求的时候要填满ip池,所以在爬虫文件的start_requests函数下手

更换ip的地方是middlewares的下载器中间件类的process_request函数,因为每个请求发起前都会经过这个函数

首先是setting文件,其实就是加两句代码

还有就是开启下载器中间件,注意是下面那个download的类,中间件的process_request函数的时候才能生效

超简单的scrapy实现ip动态代理与更换ip的方法实现

下载器中间件的process_request函数,进行ip代理和固定次数更还ip代理池

最后就是爬虫文件的start_requests函数,就是第一次发请求前要先填满ip池的ip

简单的ip代理以及固定次数就更换ip池就完成了

到此这篇关于超简单的scrapy实现ip动态代理与更换ip的方法实现的文章就介绍到这了,更多相关scrapy ip动态代理与更换ip内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

原文链接：https://blog.csdn.net/weixin_44864260/article/details/115024231