文件名称:cef-nominal-rolls:处理和分析 CEF Nominal Rolls
文件大小:28.27MB
文件格式:ZIP
更新时间:2024-06-30 05:17:54
Python
CEF 名义卷 感谢的成员,的名义以数字格式提供,供研究人员阅读。 不幸的是,与,它们是图像,因此不容易被计算机搜索或读取。 该存储库包含用于处理和分析 Nominal Rolls 的代码,并有望成为一种更简单的浏览或搜索方式(如果一切按计划进行。) 注意:此存储库中不包含实际名义卷,因为它们将远远超过 GitHub 的托管配额。 有关获取 PDF 的信息,请。 要求 Nominal Rolls 使用存储在本地,但由于它们的大小,这里不可用。 如果您想分析它们,您需要自己从上面的 CEFSG 站点下载它们。 脚本是用 Python 编写的,可能需要以下内容: 其中大部分可以通过您的包管理器或 Python 发行版安装。 可用脚本 abbyy2pdf.py将 ABBYY XML 文件转换为 PDF。 这个脚本只是一个测试,看看 OCR 过程产生了什么样的结果。 它不打算生成专业的 PD