juriscraper:抓取美国法院网站以获取元数据的API

时间:2024-05-18 16:45:32
【文件属性】:

文件名称:juriscraper:抓取美国法院网站以获取元数据的API

文件大小:34.73MB

文件格式:ZIP

更新时间:2024-05-18 16:45:32

government scraping courts pacer HTML

这是什么? Juriscraper是一个刮板库,成立于几年前,在美国法院系统中收集司法意见,口头辩论和PACER数据。 目前可以抓取: PACER系统中的各种页面和报告 所有主要上诉联邦法院的意见 除佐治亚州外,所有其他州法院的最终决定(通常是其“最高法院”) 所有提供上诉的联邦法院的口头辩论 法学专家是一个由两部分组成的系统的一部分。 第二部分是您的代码,称为Juriscraper。 您的代码负责调用刮板,下载并保存其结果。 已经开发了调用方的参考实现,该参考实现已在中使用。 可以在该调用者的代码。 中还一个基本的样本调用,可用于测试或在开发自己的程序时作为起点。 该项目的一些设计目标是: 支持视频,口头辩论音频等的可扩展性 支持地理区域的可扩展性(美国,古巴,墨西哥,加利福尼亚) 通过魔术数字识别哑剧类型 具有最少代码重复的通用体系结构 由lxml的html解析器支持的基于


网友评论