文件名称:slasherrb:抓取网页内容
文件大小:12KB
文件格式:ZIP
更新时间:2024-08-05 07:54:10
Ruby
斜线 这个项目实际上是的 ruby 版本。 Slasher 是一个可以提取 HTML 文章文档主要内容的库。 提取的结果取决于对 HTML 文档结构本身的假设。 因此,如果文档与库识别的结构不匹配,则结果可能存在缺陷。 这种情况会使图书馆不时得到改善。 如何安装 像其他 rubygems 一样,只需: gem install slasher 或者把它放在你的Gemfile gem 'slasher' 如何使用 要使用该库,您首先需要有一个 HTML 文档。 require 'net/http' require 'slasher' uri = URI ( "http://sea-games-2015.liputan6.com/read/2252937/all-indonesia-finals-ganda-putra-sumbang-emas" ) html = Net
【文件预览】:
slasherrb-master
----changelog.md(216B)
----Gemfile(168B)
----Gemfile.lock(2KB)
----slasher.gemspec(811B)
----.rspec(53B)
----doc()
--------website_coverage.md(529B)
----spec()
--------slasher()
--------spec_helper.rb(4KB)
--------slasher_spec.rb(1KB)
--------fixtures()
----.gitignore(640B)
----lib()
--------slasher()
--------slasher.rb(845B)
----README.md(2KB)