【文件属性】:
文件名称:crawler:搜寻器以找到需要检查的URL
文件大小:18KB
文件格式:ZIP
更新时间:2021-05-14 22:18:17
Groovy
README v1.0 / 2015-08-17
履带式
介绍
我们需要一个搜寻器来在我们的网站上查找不是“通常的图片,幻灯片和办公室”文件类型的文件。 凡是不是“正常”且可能产生“问题”的事物,都应找到并放在清单中以供审核。 这正是该爬虫所做的。
特别感谢允许重用他的代码。
用法
crawler$ groovy src / de / fau / rrze / pp / crawler / Crawler . groovy
贡献
发出拉取请求。 将对其进行评估,并且很可能将其合并。
帮助
目前,除了知识和理解之外,没有其他帮助... :frowning_face:
安装
要求
克隆此存储库
git clone https://github.com/RRZE-PP/crawler.git
配置
在src/de/fau/rrze/pp/crawler/Crawler.groovy更改列表seedUrls.add(""
【文件预览】:
crawler-master
----.project(428B)
----src()
--------de()
----LICENSE.md(34KB)
----README.md(2KB)
----.classpath(366B)
----.gitignore(33B)
----log4jconfig.groovy(950B)