文件名称:rebook:清理书本扫描的工具集合
文件大小:64KB
文件格式:ZIP
更新时间:2024-05-24 12:33:13
Python
重新预订:各种书籍扫描处理程序 播种 batch.py包含一个用于裁剪图像集合的各种输入格式并创建PDF的系统。 变形 dewarp.py包含两种变形算法的实现: 目前假定焦距是iPhone 7的焦距,因为这就是我一直在测试的焦距。 如果使用其他相机,请更改此文件顶部的f值。 金等。 算法似乎确实有效(并且足够快,可以在合理的时间内处理大量页面); 您可以直接使用它,也可以通过batch.py --dewarp使用它。 二值化 binarize.py包含大量的二值化算法,所有这些算法都应具有最优化的实现。 Niblack二值化 (背景估计部分不完整) (DIBCO 2013冠军) 2014年,一种用于手写文档图像二值化的组合方法 最后一种算法是我在这组输入中找到的最好的算法。 文字结构 block.py包含一些文本结构化的东西。 我打算用它代替当前的文本行检测系统,但是
【文件预览】:
rebook-master
----setup.py(268B)
----.gitignore(112B)
----collate.pyx(2KB)
----requirements.txt(493B)
----__init__.py(0B)
----rebook()
--------training.py(3KB)
--------lib.py(2KB)
--------dewarp.py(42KB)
--------mrcdi.py(14KB)
--------geometry.py(8KB)
--------neighbor.py(7KB)
--------__init__.py(0B)
--------batch.py(8KB)
--------upscale.py(3KB)
--------algorithm.py(16KB)
--------block.py(8KB)
--------sparse_rep.py(16KB)
--------test.py(3KB)
--------binarize.py(17KB)
--------dataset.py(1KB)
--------feature_sign_obsolete.py(15KB)
--------crop.py(3KB)
--------letters.py(7KB)
----README.md(5KB)
----inpaint.pyx(3KB)
----newton.pyx(8KB)
----feature_sign.pyx(6KB)