【文件属性】:
文件名称:vessel:快速的高级Web爬网Ruby框架
文件大小:14KB
文件格式:ZIP
更新时间:2021-05-06 10:40:33
Ruby
容器-高级Web爬网框架
与Chrome一样快,简单却可扩展。
它是基于Ruby高级Web爬网框架,用于从网站中提取所需的数据。 它可以用于各种场景,例如数据挖掘,监视或历史档案。 对于自动化测试,我们建议使用 。
感谢Evrone。 阅读有关Evrone支持的和其他项目的。
安装
将此添加到您的Gemfile中:
gem "vessel"
环顾四周
为了向您展示Vessel的工作方式,我们将一起搜集:
require "json"
require "vessel"
class QuotesToScrapeCom < Vessel :: Cargo
domain "quotes.toscrape.com"
start_urls "http://quotes.toscrape.com/tag/humor/"
def parse
css ( "div.quote"
【文件预览】:
vessel-master
----bin()
--------vessel(62B)
--------console(341B)
----Rakefile(139B)
----.github()
--------FUNDING.yml(678B)
----vessel.gemspec(1KB)
----LICENSE(1KB)
----Gemfile(103B)
----examples()
--------quotes.toscrape.com.rb(950B)
----spec()
--------scheduler_spec.rb(2KB)
--------middleware_spec.rb(427B)
--------cargo_spec.rb(1KB)
--------blog_scrapinghub_com.rb(417B)
--------spec_helper.rb(212B)
--------engine_spec.rb(3KB)
----.gitignore(83B)
----lib()
--------vessel.rb(304B)
--------vessel()
----README.md(3KB)