文件名称:voyager:抓取和刮擦生锈的网页
文件大小:29KB
文件格式:ZIP
更新时间:2024-03-28 01:20:23
Rust
航海家 使用voyager,您可以轻松地从网站中提取结构化数据。 按照状态机模型,用voyager编写自己的爬虫/爬虫。 例子 这些示例使用作为其运行时,因此您的Cargo.toml可能如下所示: [ dependencies ] voyager = { version = " 0.1 " } tokio = { version = " 1.0 " , features = [ " full " ] } 声明自己的刮板和模型 // Declare your scraper, with all the selectors etc. struct HackernewsScraper { post_selector: Selector, author_selector: Selector, title_selector: Selector, comment_
【文件预览】:
voyager-main
----LICENSE-MIT(1KB)
----LICENSE-APACHE(11KB)
----.github()
--------workflows()
----src()
--------error.rs(3KB)
--------requests.rs(4KB)
--------robots.rs(9KB)
--------response.rs(811B)
--------lib.rs(22KB)
--------domain.rs(22KB)
----Cargo.toml(809B)
----examples()
--------hackernews.rs(4KB)
--------reddit.rs(4KB)
--------explore.rs(2KB)
----.gitignore(25B)
----README.md(8KB)