crawlerjs:检索网页链接的爬虫 SAP

时间:2024-07-12 19:03:08
【文件属性】:

文件名称:crawlerjs:检索网页链接的爬虫 SAP

文件大小:13KB

文件格式:ZIP

更新时间:2024-07-12 19:03:08

JavaScript

爬虫 检索网页的爬虫将 SAP 与链接。 依赖关系 是启动爬虫所必需的。 安装很简单,去官网了解详情。 用法 首先安装依赖 cd crawler npm install 爬虫站点地图 CrawlerSitemap 检索站点地图中的 URL 并分析所有页面以查找链接。 Usage: node crawlerSitemap.js [OPTION] baseUrl -s, --sitemap=ARG Sitemap path (HTTP or FileSystem) -o, --output=ARG CSV file to save links -p, --processes=ARG number of processes to launch in same time (default: 5) -d, --delimitor=ARG Delimitor CS


【文件预览】:
crawlerjs-master
----.gitignore(36B)
----searchLinks.js(6KB)
----README.md(1KB)
----crawlerSearch.js(5KB)
----util.js(2KB)
----LICENSE(1KB)
----package.json(411B)
----lib()
--------crawler.js(3KB)
--------netsniff.js(4KB)
----crawlerSitemap.js(6KB)

网友评论