文件名称:Python-一个简单的Python爬虫
文件大小:26KB
文件格式:ZIP
更新时间:2022-08-30 01:25:14
Python开发-Web爬虫
一个简单的Python爬虫,核心模块:URL管理器、(网页)下载器、(网页)解析器
【文件预览】:
TinyCrawler-master
----.gitattributes(378B)
----README.md(538B)
----baike_crawler()
--------url_manager.py(659B)
--------crawler_main.py(1KB)
--------html_outputer.py(997B)
--------html_parser.py(1KB)
--------__init__.py(0B)
--------output.html(39KB)
--------html_downloader.py(282B)
----pic_crawler()
--------url_manager.py(659B)
--------html_outputer.py(2KB)
--------html_parser.py(1KB)
--------__init__.py(75B)
--------pic_main.py(2KB)
--------html_downloader.py(283B)
----.gitignore(669B)