文件名称:a-little-spider::rainbow: 一只叫做Python的小小爬虫~
文件大小:31KB
文件格式:ZIP
更新时间:2024-05-20 07:22:29
Python
a-little-spider 此文件共两个项目,demo2和spider。demo2是我维护博客过程中帮助自己减轻工作量而写的一个爬虫程序,spider项目为python爬虫的一个小练习。 demo2 由于我的csdn博客和liuchuo.net博客上有一些代码并不对应,所以写了一个爬虫查找所有不对应的博客文章并输出markdown表格。 主要功能: 爬取csdn上所有PAT甲级的文章,并将结果返回在item_list 爬取liuchuo.net上所有PAT甲级的文章,并将结果返回在item_dict 获取csdn博客上所有PAT甲级文章的代码片段,并将代码中的空格去除 获取liuchuo.net上所有PAT甲级文章的代码片段,并将代码中的空格去除 比较csdn和liuchuo.net的代码,将代码不相同的文章列表用markdown语法以表格的形式输出到outpud.md文件中 (乙级同
【文件预览】:
a-little-spider-master
----.gitignore(6B)
----LICENSE(34KB)
----README.md(2KB)
----demo2()
--------output.md(17KB)
--------article.py(658B)
--------.idea()
--------spider_main.py(3KB)
----spider()
--------.idea()
--------spider()