文件名称:ged-www:GE项目回购
文件大小:3KB
文件格式:ZIP
更新时间:2024-05-30 14:33:26
JavaScript
ged-www 就本项目而言,我将Internet定义为internet1.json和internet2.json的测试数据,并将Web爬网程序定义为从Internet请求页面,解析内容以提取页面中所有链接的软件,并访问链接以将这些页面抓取到无限深。 假设条件 根据给我的笔记,我有以下假设: internet.pages.address每个链接将始终是成功的爬网,即进入“ results.sucess”数组 internet.pages.address和internet.pages.links之间的任何重复都将被视为跳过并进入“ results.skipped”数组 其他任何情况都将被视为错误,并且将是“ results.error” internet1.json的预期输出为: Success: ["http://foo.bar.com/p1", "http://foo.bar.co
【文件预览】:
ged-www-master
----package.json(250B)
----src()
--------internet2.json(592B)
--------internet1.json(647B)
----index.js(2KB)
----README.md(1KB)