文件名称:Python简单爬虫
文件大小:2KB
文件格式:RAR
更新时间:2019-04-16 17:17:28
Pyrhon,爬虫
使用Python编写的简单爬虫,可以爬取若干个百度百科网页,可以自行修改。使用BeautifulSoup解析网页,使用MySQL数据库存储已访问过的URL,以使得程序不会重复爬取网页(但是会降低速度)
【文件预览】:
spider.py
文件名称:Python简单爬虫
文件大小:2KB
文件格式:RAR
更新时间:2019-04-16 17:17:28
Pyrhon,爬虫
使用Python编写的简单爬虫,可以爬取若干个百度百科网页,可以自行修改。使用BeautifulSoup解析网页,使用MySQL数据库存储已访问过的URL,以使得程序不会重复爬取网页(但是会降低速度)