文件名称:zhihu_sexy_girls:抓取项目3
文件大小:22.11MB
文件格式:ZIP
更新时间:2024-06-02 19:10:53
Python
zhihu_sexy_girls 我的第三个爬虫项目: Scrapy + MySQL + 倒立验证码识别 爬取知乎上的小姐姐们的照片 crawl project 3: (Scrapy + MySQL + catpcha recognition) -> sexy_girls.jpg 更新日志 log 最近发现知乎又双叒叕更新了。。这两天对这个repo模拟登录部分进行更新。 日期 更新内容 1/30/2018 最新版知乎模拟登录(2018年初) date update 1/20/2018 up-to-date (2018-) Zhihu logging 写在前面 notice 此爬虫适用于爬取任意知乎收藏夹。可以对里的start_urls进行修改。 The project is able crawl (almost) any zhihu favorites by simply modifyin
【文件预览】:
zhihu_sexy_girls-master
----images()
--------sql_image.png(1.15MB)
--------girls_image.png(941KB)
----.DS_Store(6KB)
----.idea()
--------dbnavigator.xml(22KB)
--------misc.xml(211B)
--------vcs.xml(180B)
--------modules.xml(284B)
--------workspace.xml(48KB)
--------zhihu_sexy_girls.iml(457B)
----.gitignore(47B)
----README.md(2KB)
----zhihu_girls()
--------login_captcha.gif(12KB)
--------main.py(154B)
--------zheye()
--------scrapy.cfg(266B)
--------zhihu_girls_result.sql(146KB)
--------test()
--------zhihu_girls_sql_create.sql(235B)
--------__pycache__()
--------.DS_Store(6KB)
--------jslog.py(29KB)
--------__init__.py(0B)
--------GirlImages()
--------temp.html(24KB)
--------zhihu_girls()