文件名称:spookystuff:适用于Web抓取数据mashupacceptance QA的可扩展查询引擎,由Apache Spark提供支持
文件大小:3.48MB
文件格式:ZIP
更新时间:2024-06-06 00:52:44
Scala
最新文档已移至: 怪异的东西 ...是用于Web抓取/数据集成/接受质量检查的可扩展查询引擎。 目的是允许像关系数据库一样查询和ETL Web。 SpookyStuff是历史上最快的大数据收集引擎,其速度记录可以每小时查询300个内核上的330404个动态页面。 建置状态 分支\个人资料 Scala2.11 Scala2.12 掌握 SpookyStuff-UAV (alpha组件) ...允许使用同一引擎来控制大量的空中机器人以进行摄影测量和数据采集。 这项工作仍在进行中,有关功能和实现概述,请参阅。 建置状态 分支\个人资料 Scala2.11 Scala2.12 掌握 -- 供电 阿帕奇火花 Selenium 汤 阿帕奇·蒂卡(Apache Tika) 阿帕奇Maven PhantomJS / GhostDriver (UAV)MAVLink 执照 版