sukhoi:极简主义和强大的Web爬网程序

时间:2024-04-20 22:40:16
【文件属性】:

文件名称:sukhoi:极简主义和强大的Web爬网程序

文件大小:13KB

文件格式:ZIP

更新时间:2024-04-20 22:40:16

Python

苏霍伊 极简主义和功能强大的Web爬网程序。 苏霍伊(Sukhoi)建立在矿工概念的基础上,类似于刮y及其蜘蛛所发生的事情。 但是,在sukhoi中,矿工可以放在列表或字典之类的结构中,以便为从页面提取的数据构造类似于json的结构。 特征 Http / https支持 学习曲线短 GET / POST请求 基本的AUTH支持 模块化的 支持LXML 支持BeautifulSoup4 非阻塞I / O 重试机制 基本例子 下面的基本示例等效于scrapy的主要示例,尽管它不仅抓取了作者的姓名,而且还完整地描述了引用的页面。 矿工继承自python列表类,因此它们可用于从页面中累积数据,也可以将它们放置在任何位置(通过这种方式,可以非常灵活地为您获取的数据构造json结构。) from sukhoi import MinerLXML , core class AuthorMine


【文件预览】:
sukhoi-master
----setup.py(493B)
----.gitignore(1KB)
----requirements.txt(63B)
----sukhoi.py(4KB)
----MANIFEST.in(89B)
----LICENSE(11KB)
----escs.sh(4KB)
----README.md(6KB)
----demo()
--------lxml_by_tag.py(1B)
--------lxml_quotes.py(2KB)
--------bs4_quotes.py(707B)
--------by_tags.py(1KB)
--------quotes.py(984B)
----MANIFEST(170B)

网友评论