文件名称:mangaSpider:漫画的 Python 蜘蛛!
文件大小:46KB
文件格式:ZIP
更新时间:2024-06-19 22:16:35
JavaScript
README.md 简易漫画爬虫, 学习使用. 感谢 项目! 关于这个项目的网页: Manhuaren 站点 的策略是使用html文件最下方的[removed]标签来动态呈现章节列表和图片. 请求图片时需要在请求头加入referer, 查看网页调试器的Network标签页可以找到. 90mh 站点 的策略类似manhuaren, 在各个章节的页面中有着放着各个图片所在链接的[removed]标签, 一部分为列表变量 "chapterImages" , 另一部分来自 "chapterPath", 形式为: "" + chapterPath + chapterImages, 如: "". 注意这个站点由于证书原因在*无法访问, 经测试改为http协议可以下载, 但速度较慢. Manhuabei 站点 的策略是使用html文件中的[removed]标签中的变量chapterImages加
【文件预览】:
mangaSpider-master
----mhcParser.py(771B)
----mhrParser.py(1KB)
----main_sele.py(2KB)
----main.py(1KB)
----geckodriver.log(13KB)
----mhgParser.py(2KB)
----config.json(107B)
----README.md(4KB)
----mhkcParser.py(1KB)
----obfsJsScr()
--------manhuabei20200824.js(192KB)
--------manhuacat20201230.js(6KB)
----.gitignore(57B)
----mhbParser.py(2KB)
----nightyMhParser.py(1KB)