文件名称:python小型爬虫系统
文件大小:10KB
文件格式:RAR
更新时间:2021-05-10 04:23:35
python,爬虫
该系统是一个小型爬虫系统,结构完整,可以爬取百度百科词条及其相关词条的标题和描述,整理输出为html文件
【文件预览】:
baike_spider
----url_manager.py(742B)
----html_outputer.py(1KB)
----html_parser.py(2KB)
----__init__.py(0B)
----output.html(7KB)
----spider_main.py(2KB)
----__pycache__()
--------html_downloader.cpython-36.pyc(647B)
--------html_parser.cpython-36.pyc(1KB)
--------url_manager.cpython-36.pyc(1KB)
--------html_outputer.cpython-36.pyc(1KB)
--------__init__.cpython-36.pyc(146B)
----html_downloader.py(364B)