文件名称:Python_Myspider:爬虫集合
文件大小:117.33MB
文件格式:ZIP
更新时间:2024-05-28 15:17:21
HTML
Anti-Anti-Spider author@luyishisi 2016-10-24 begin #2017-5-8 end 爬虫的开源项目到现在半年差不多有900+的star了,,接下来就是要玩玩验证码破解了,定一个阶段性目标,前进!再建议一个开源项目,目标1000star!! 仓库网址位于 欢迎stat 本项目由URLTEAM维护 作者博客 项目简介: 运用请求伪造,浏览器伪造,浏览器自动化,图像处理,ip处理等方式进行反爬虫技术的通用化代码库,方便未来快速开发。 为以后的采集任务快速开展留下基础代码。 如今项目会包含多项技术的样例代码. 项目起因 本身是想做一个反爬虫的技术攻关站点,如果在总结诸多技术中发觉可以将反反爬虫技术直接保留与代码中。 在之后采集需要时能快速有效的测试该站点具有怎样的反爬特性,并且可以快速的进行代码复用 你可以做什么: 提交你觉得难以采集的网站 联系方