文件名称:python抓取百度百科1000条记录
文件大小:3KB
文件格式:ZIP
更新时间:2019-05-28 13:40:38
python,爬虫
python抓取百度百科1000条记录,只要一个百度百科的入口链接:如: root_url = "http://baike.baidu.com/view/9936357.htm".入口文件是spider_main.py
【文件预览】:
baike_spider
----url_manager.py(783B)
----html_outputer.py(846B)
----html_parser.py(1KB)
----__init__.py(0B)
----spider_main.py(1KB)
----html_downloader.py(341B)