【文件属性】:
文件名称:digger:Digger是由纯golang实现的强大而灵活的Web搜寻器
文件大小:1.49MB
文件格式:ZIP
更新时间:2021-03-19 00:45:22
crawler spider digger Go
简介
是用纯开发的配置式分布式跨平台爬虫系统,支持使用Javascript编写插件来实现各种您想要达到的目标。Digger及相关组件能够以极低的资源消耗在各种廉价服务器和Digger没有复杂的依赖,部署十分简单,支持Linux和Windows平台,目前支持的CPU架构有: amd64 , arm , arm64
您可以在快速体验功能。
由于资源有限,请合理使用演示环境,定时任务会在每天0点清理数据。
功能简介
支持使用Css选择器和Xpath选择器
支持多种结果类型:纯文本,html,数组等
网站在线调试爬虫配置,精准定位问题
支持插件功能
实时浏览爬虫日志
结果在线浏览,导出,一键生成数据库schema(postgres和mysql)
定时任务
支持暂停任务
分散worker实例,有效避免爬虫被block
支持http代理
支持机器人指令检测
支持任务和worker标签匹配调度功能
支