文件名称:爬虫学习入门,百度百科-爬虫,非框架
文件大小:25KB
文件格式:ZIP
更新时间:2020-10-31 04:46:18
爬虫,python
自己实现的百度百科爬虫,非框架,可运行,可用于新手学习入门,通过此项目可清晰了解爬虫实现的基本原理
【文件预览】:
TestSpider
----HtmlDownloader.py(410B)
----HtmlParser.py(2KB)
----baike.html(29KB)
----SpiderMan.py(2KB)
----URLManager.py(1KB)
----.idea()
--------misc.xml(255B)
--------workspace.xml(18KB)
--------TestSpider.iml(398B)
--------modules.xml(272B)
----Test.py(1KB)
----DataOutput.py(848B)
----__pycache__()
--------DataOutput.cpython-37.pyc(1KB)
--------HtmlDownloader.cpython-37.pyc(665B)
--------URLManager.cpython-37.pyc(2KB)
--------HtmlParser.cpython-37.pyc(1KB)