Python简单爬虫

时间:2019-04-16 17:17:28
【文件属性】:

文件名称:Python简单爬虫

文件大小:2KB

文件格式:RAR

更新时间:2019-04-16 17:17:28

Pyrhon,爬虫

使用Python编写的简单爬虫,可以爬取若干个百度百科网页,可以自行修改。使用BeautifulSoup解析网页,使用MySQL数据库存储已访问过的URL,以使得程序不会重复爬取网页(但是会降低速度)


【文件预览】:
spider.py

网友评论