文件名称:real-easy-crawler:使用Nokogiri和RestClient的ruby爬虫
文件大小:17KB
文件格式:ZIP
更新时间:2024-04-10 08:30:29
Ruby
真正容易的爬虫-Ruby
一个简单的ruby脚本,具有Nokogiri和RestClient宝石,可抓取网站上的html内容并将数据序列化为JSON,以存储在本地。高度实验性的项目。使用风险自负。
先决条件:
rvm(rvm.io)
Ruby解释器(2.7.0)
所需的宝石(请参阅Gemfile)
linux终端
当前状态:
此项目涉及的模块和API:
要添加的功能[即将推出...]
功能1
设置rvm和进程事件系列的用法:
获取最新的ruby解释器$ rvm install ruby
创建一个宝石集$ rvm gemset create
【文件预览】:
real-easy-crawler-master
----.rubocop.yml(63KB)
----README.md(3KB)
----Gemfile(357B)