文件名称:digger:Digger是由纯golang实现的强大而灵活的Web搜寻器
文件大小:1.49MB
文件格式:ZIP
更新时间:2024-04-07 18:32:02
crawler spider digger Go
简介 是用纯开发的配置式分布式跨平台爬虫系统,支持使用Javascript编写插件来实现各种您想要达到的目标。Digger及相关组件能够以极低的资源消耗在各种廉价服务器和Digger没有复杂的依赖,部署十分简单,支持Linux和Windows平台,目前支持的CPU架构有: amd64 , arm , arm64 您可以在快速体验功能。 由于资源有限,请合理使用演示环境,定时任务会在每天0点清理数据。 功能简介 支持使用Css选择器和Xpath选择器 支持多种结果类型:纯文本,html,数组等 网站在线调试爬虫配置,精准定位问题 支持插件功能 实时浏览爬虫日志 结果在线浏览,导出,一键生成数据库schema(postgres和mysql) 定时任务 支持暂停任务 分散worker实例,有效避免爬虫被block 支持http代理 支持机器人指令检测 支持任务和worker标签匹配调度功能 支