crawler:搜寻器以找到需要检查的URL

时间:2021-05-14 22:18:17
【文件属性】:
文件名称:crawler:搜寻器以找到需要检查的URL
文件大小:18KB
文件格式:ZIP
更新时间:2021-05-14 22:18:17
Groovy README v1.0 / 2015-08-17 履带式 介绍 我们需要一个搜寻器来在我们的网站上查找不是“通常的图片,幻灯片和办公室”文件类型的文件。 凡是不是“正常”且可能产生“问题”的事物,都应找到并放在清单中以供审核。 这正是该爬虫所做的。 特别感谢允许重用他的代码。 用法 crawler$ groovy src / de / fau / rrze / pp / crawler / Crawler . groovy 贡献 发出拉取请求。 将对其进行评估,并且很可能将其合并。 帮助 目前,除了知识和理解之外,没有其他帮助... :frowning_face: 安装 要求 克隆此存储库 git clone https://github.com/RRZE-PP/crawler.git 配置 在src/de/fau/rrze/pp/crawler/Crawler.groovy更改列表seedUrls.add(""
【文件预览】:
crawler-master
----.project(428B)
----src()
--------de()
----LICENSE.md(34KB)
----README.md(2KB)
----.classpath(366B)
----.gitignore(33B)
----log4jconfig.groovy(950B)

网友评论