jules:Ruby 中的高级数据挖掘爬虫

时间:2024-07-30 11:33:03
【文件属性】:

文件名称:jules:Ruby 中的高级数据挖掘爬虫

文件大小:79KB

文件格式:ZIP

更新时间:2024-07-30 11:33:03

Ruby

朱尔斯 实验性的 gem 'jules' 一种快速编写刮板的新方法。 这仍然是一个正在进行的项目。 require 'open-uri' require 'jules' source = URI . parse ( 'https://news.ycombinator.com' ) . read filters = { title : 'td.title' , comments : [ /( \d +) comments/ , :optional ] , points : /( \d +) points/ } items = Jules . collect ( source , filters ) # [{title: '2 years with Angular', comments: '95', points: '245'}, # {title: 'Pola


【文件预览】:
jules-master
----.gitignore(22B)
----jules.gemspec(690B)
----README.md(2KB)
----lib()
--------enumerable()
--------nokogiri()
--------simhash()
--------jules()
--------jules.rb(5KB)
----Gemfile(38B)
----Rakefile(117B)
----test()
--------html()
--------test_simhash.rb(3KB)
--------test_nokogiri.rb(620B)
--------test_enumerable.rb(386B)
--------helper.rb(36B)
--------test_jules.rb(9KB)

网友评论