文件名称:Gif_Spider:GIF图片的蜘蛛
文件大小:10KB
文件格式:ZIP
更新时间:2024-06-06 14:08:39
Python
Gif_Spider 获取GIF资源文件 说明以及具体操作流程日后补上 经常逛A站和B站的人,肯定对一个节目不陌生《网络上常见的GIF动态图》 今天就来分享一下,怎么通过爬虫自动的将这些个动作收藏到自己的电脑中(其实这个程序5月份就写好了,一直拖到现在才想起来将它分享出来)。 一.思路分析 按照爬虫的基本规律: 1.找到目标 2.抓取目标 3.处理目标内容,获取有用的信息 .首先我们的目标是: 即找动图就上 GIFFCC.COM 这个网站呢,是一个论坛式网站,里面分了几大类,反正试试各种动图。 我们的目标呢,就是找到这(收)些(藏)动(到)图(自)的(己)地(电)址(脑). 2.看一下各个模块的网址,看一下有什么规律 ' '', #美女GIF动态图出处 ' ' ' ' 对的,没错,如果以游客身份访问,那么各个板块的网址就是这样的形式 -1.html 那么每个模块中的内容又有什么规律
【文件预览】:
Gif_Spider-master
----README.md(11KB)
----01_get_git_url.py(9KB)
----03_from_mongodb_save_pic.py(896B)
----02_delete_repeat_url_in_mongodb.py(2KB)