scrapey:用 Node.js 编写的网页抓取实用程序

时间:2024-06-23 12:44:49
【文件属性】:

文件名称:scrapey:用 Node.js 编写的网页抓取实用程序

文件大小:6KB

文件格式:ZIP

更新时间:2024-06-23 12:44:49

JavaScript

刮皮 已弃用 用 Node.js 编写的网页抓取实用程序。 Scrapy 充当 、 、 和其他在页面抓取中有用的模块之间的粘合层。 Scrapy 仍处于非常早期的开发阶段,但底层模块是稳定的。 基本用法 Scrapy 最简单的用法如下所示。 var Scrapey = require("scrapey"); Scrapey({ request: { url: "http://coolsite.org" } }, function(error, result) { var dom = result.dom; var title = result.dom("head").text(); }); Scrapey 有两个参数, options和callback 。 options是一个用于配置 Scrapy 和底层模块的对象。 options的预期格式如下所述。


【文件预览】:
scrapey-master
----.gitignore(534B)
----README.md(4KB)
----test()
--------server.js(455B)
--------index.js(2KB)
--------files()
----LICENSE(1KB)
----package.json(714B)
----index.js(35B)
----lib()
--------index.js(2KB)

网友评论