爬虫基础框架

时间:2021-07-14 10:09:20
【文件属性】:

文件名称:爬虫基础框架

文件大小:12KB

文件格式:RAR

更新时间:2021-07-14 10:09:20

python 框架 爬虫

python 爬虫基础框架,爬的网站是百度百科,根据百度百科一条网址,爬取词条和词条内容,并根据词条中的超链接爬取下一个词条和内容,循环


【文件预览】:
爬虫框架
----WebDownloader.py(306B)
----SpiderManager.py(1KB)
----__pycache__()
--------WebParser.cpython-36.pyc(1KB)
--------WebDownloader.cpython-36.pyc(558B)
--------DataOutput.cpython-36.pyc(642B)
--------UrlManager.cpython-36.pyc(1010B)
----DataOutput.py(383B)
----baike1.csv(10KB)
----WebParser.py(951B)
----UrlManager.py(1KB)

网友评论