文件名称:supreme-court-transcripts:试图解析最高法院口头辩论笔录
文件大小:5KB
文件格式:ZIP
更新时间:2024-05-21 10:24:40
JavaScript
最高法院成绩单 试图解析最高法院的口头辩论笔录。 要求 安装pdftk: : brew install qpdf安装qpdf: brew install qpdf安装poppler: brew install poppler 获取成绩单 mkdir raw pdf json npm install # Scrape 2010-2014 transcripts node scrape.js # Remove empty password junk as needed? #for f in $(ls raw); do qpdf --decrypt raw/$f pdf/$f; done # Convert PDFs to JSON arrays of pages, each page an array of lines, filtering out empty lines node conv
【文件预览】:
supreme-court-transcripts-master
----convert.js(979B)
----package.json(716B)
----clean.js(6KB)
----README.md(904B)
----scrape.js(2KB)