a-little-spider::rainbow: 一只叫做Python的小小爬虫~

时间:2024-05-20 07:22:29
【文件属性】:

文件名称:a-little-spider::rainbow: 一只叫做Python的小小爬虫~

文件大小:31KB

文件格式:ZIP

更新时间:2024-05-20 07:22:29

Python

a-little-spider 此文件共两个项目,demo2和spider。demo2是我维护博客过程中帮助自己减轻工作量而写的一个爬虫程序,spider项目为python爬虫的一个小练习。 demo2 由于我的csdn博客和liuchuo.net博客上有一些代码并不对应,所以写了一个爬虫查找所有不对应的博客文章并输出markdown表格。 主要功能: 爬取csdn上所有PAT甲级的文章,并将结果返回在item_list 爬取liuchuo.net上所有PAT甲级的文章,并将结果返回在item_dict 获取csdn博客上所有PAT甲级文章的代码片段,并将代码中的空格去除 获取liuchuo.net上所有PAT甲级文章的代码片段,并将代码中的空格去除 比较csdn和liuchuo.net的代码,将代码不相同的文章列表用markdown语法以表格的形式输出到outpud.md文件中 (乙级同


【文件预览】:
a-little-spider-master
----.gitignore(6B)
----LICENSE(34KB)
----README.md(2KB)
----demo2()
--------output.md(17KB)
--------article.py(658B)
--------.idea()
--------spider_main.py(3KB)
----spider()
--------.idea()
--------spider()

网友评论