文件名称:WSpider, 抓取网页数据的蜘蛛项目.zip
文件大小:169KB
文件格式:ZIP
更新时间:2022-10-07 11:13:56
开源
WSpider, 抓取网页数据的蜘蛛项目 简介SinaWSpider:Mini爬虫爬取新浪数据,详细步骤参见新浪微博数据爬取Part 3:小爬虫的诞生SinaLogin:模拟登录新浪微博,详细步骤参见模拟新浪微博登录-原理分析到实现
【文件预览】:
WSpider-master
----ZhiHuPro()
--------WSpider.py(4KB)
--------temp()
--------out()
--------zhiHuLogin.py(3KB)
----WSpider.py(4KB)
----SinaLogin()
--------Logger.py(1KB)
--------dataEncode.pyc(3KB)
--------Logger.pyc(1KB)
--------dataEncode.py(3KB)
--------SinaSpider.py(6KB)
--------out()
----SinaWSpider()
--------myconf.pyc(7KB)
--------main.py(4KB)
--------Logger.py(1KB)
--------dataEncode.pyc(2KB)
--------SinaSpider.pyc(13KB)
--------Logger.pyc(1KB)
--------output()
--------dataEncode.py(3KB)
--------SinaSpider.py(16KB)
--------proxy()
--------__init__.py(0B)
--------myconf.py(8KB)
--------proxy.data(733B)
--------conf.ini(514B)
--------README.md(3KB)
--------MongoQueue.py(2KB)
----README.md(2KB)