csdn-spider:爬取CSDN上的博客文章

时间:2024-06-08 14:59:31
【文件属性】:

文件名称:csdn-spider:爬取CSDN上的博客文章

文件大小:3KB

文件格式:ZIP

更新时间:2024-06-08 14:59:31

spider csdn csdnspider Python

基于Python的Csdn博客爬虫(多线程) 说明 爬取Csdn某个博主的所有博文,并下载到本地(暂时只支持保存html格式),加入了多线程,爬取更快速。 SpiderGui----------------->爬虫gui界面 CsdnBlogSpider------------>爬虫主程序 环境 Python3.4 运行 * 确保安装Python解释器。 * SpiderGui.py * 提示输入要爬取的博客名和开启线程数,根据自己需求配置 * 开始爬取,存储在当前目录的blog文件夹下 存在问题 本爬虫还不够完善,欢迎大家指导


【文件预览】:
csdn-spider-master
----README.md(598B)
----SpiderGui.py(3KB)
----CsdnBlogSpider.py(2KB)

网友评论

  • 你好 下载后文件夹没有东西啊