【文件属性】:
文件名称:supreme-court-transcripts:试图解析最高法院口头辩论笔录
文件大小:5KB
文件格式:ZIP
更新时间:2021-05-01 16:38:00
JavaScript
最高法院成绩单
试图解析最高法院的口头辩论笔录。
要求
安装pdftk: : brew install qpdf安装qpdf: brew install qpdf安装poppler: brew install poppler
获取成绩单
mkdir raw pdf json
npm install
# Scrape 2010-2014 transcripts
node scrape.js
# Remove empty password junk as needed?
#for f in $(ls raw); do qpdf --decrypt raw/$f pdf/$f; done
# Convert PDFs to JSON arrays of pages, each page an array of lines, filtering out empty lines
node conv
【文件预览】:
supreme-court-transcripts-master
----convert.js(979B)
----package.json(716B)
----clean.js(6KB)
----README.md(904B)
----scrape.js(2KB)