文件名称:百度百科爬虫
文件大小:62KB
文件格式:ZIP
更新时间:2021-01-26 08:26:57
百度百科爬虫
Python3.5实现的爬虫,截至2018年1月06日可用,为了测试方便我在循环里循环到50次强制退出了,大家可以自行修改。
【文件预览】:
baike_spyder
----spider_main.py(1KB)
----url_manager.py(755B)
----.git()
--------index(1014B)
--------hooks()
--------config(312B)
--------description(73B)
--------refs()
--------logs()
--------objects()
--------info()
--------COMMIT_EDITMSG(13B)
--------HEAD(23B)
--------FETCH_HEAD(0B)
----__pycache__()
--------url_manager.cpython-35.pyc(1KB)
--------html_downloader.cpython-35.pyc(774B)
--------html_parser.cpython-35.pyc(2KB)
--------html_outputer.cpython-35.pyc(1KB)
----output.html(31KB)
----html_outputer.py(1KB)
----html_downloader.py(450B)
----html_parser.py(1KB)