文件名称:github-mirror:以多云方式镜像Github的脚本
文件大小:623KB
文件格式:ZIP
更新时间:2024-02-22 22:17:42
ruby github-api ghtorrent RubyRuby
ghtorrent:来自Github API的镜像和索引数据 一个库和一组脚本,用于以模块化和可扩展的方式从Github API检索数据并提取SQL数据库中的元数据。 这些脚本以Gem( ghtorrent )的形式分发,但是也可以通过检出此存储库来运行它们。 GHTorrent可以用于多种目的,例如: 镜像Github API事件流,并跟踪事件到实际数据的链接,以逐步构建 为特定存储库创建可查询的元数据数据库 构造一个数据源以一个或多个存储库的(例如,参见) 组件 GHTorrents组件(可以单独使用)是: :知道如何查询Github API(单个实体和页面)并遵守API请求限制。 如果是多宿主主机,可以配置为覆盖默认IP地址。 :知道如何通过名称检索特定的Github实体(用户,存储库,观察者)。 使用可选的持久程序以避免检索未更改的数据。 :一个键/值存储,可以由一个真实的键/值存储支持,以存储Github JSON回复并根据请求查询它们。 备用键/值存储必须支持对存储的JSON对象的任意查询。 :知道如何从检索器检索的数据中提取信息,以便使用元数据更新SQL