文件名称:爬虫基础框架
文件大小:12KB
文件格式:RAR
更新时间:2021-07-14 10:09:20
python 框架 爬虫
python 爬虫基础框架,爬的网站是百度百科,根据百度百科一条网址,爬取词条和词条内容,并根据词条中的超链接爬取下一个词条和内容,循环
【文件预览】:
爬虫框架
----WebDownloader.py(306B)
----SpiderManager.py(1KB)
----__pycache__()
--------WebParser.cpython-36.pyc(1KB)
--------WebDownloader.cpython-36.pyc(558B)
--------DataOutput.cpython-36.pyc(642B)
--------UrlManager.cpython-36.pyc(1010B)
----DataOutput.py(383B)
----baike1.csv(10KB)
----WebParser.py(951B)
----UrlManager.py(1KB)