buzzsaw:用于nokogiri的Web抓取DSL

时间:2024-06-07 05:11:57
【文件属性】:

文件名称:buzzsaw:用于nokogiri的Web抓取DSL

文件大小:9KB

文件格式:ZIP

更新时间:2024-06-07 05:11:57

Ruby

电锯 缠绕在Nokogiri DSL,由Nokogiri用于网络抓取。 安装 将此行添加到您的应用程序的Gemfile中: gem 'buzzsaw' 然后执行: $ bundle 或将其自己安装为: $ gem install buzzsaw 用法 Stretch.io用于DSL的就是这个宝石-基于JSON的脚本和包含脚本的DSL。 但是,您可以独立使用它。 查询DSL find_by_xpath 在大多数情况下,我在抓取Web时,只想在匹配的xpath中找到匹配文本的第一位。 这就是为什么find_by_xpath是此查询DSL的主力军。 此方法采用以下参数: xpath :要搜索给定模式的节点的xpath查询字符串。 此参数是强制性的。 match :xpath节点的文本应匹配的正则表达式。 capture :一个正则表达式,仅将匹配的文本从匹配的字符串中拉出


【文件预览】:
buzzsaw-master
----LICENSE.txt(1KB)
----buzzsaw.gemspec(1KB)
----lib()
--------buzzsaw.rb(186B)
--------buzzsaw()
----Gemfile(92B)
----spec()
--------fixtures()
--------spec_helper.rb(136B)
--------dsl_spec.rb(3KB)
----Rakefile(29B)
----README.md(5KB)
----.gitignore(118B)

网友评论