【文件属性】:
文件名称:cp2t:将PDF转换为TEXT(保留表)
文件大小:7KB
文件格式:ZIP
更新时间:2021-05-24 08:57:06
Python
CP2T:将PDF转换为文本(保留表)
关于
该程序使用一些现有工具将PDF转换为TEXT或HTML保留表
先决条件
需要的库:
OpenCV( )-> OpenCV取决于numpy和scipy
BeautifulSoup( )
枕头( )
临时文件
在Debian之类的版本中,“ apt-get install”将可以正常工作
安装
只需将cp2t.py复制到您的工作目录中
例子
它可以作为命令行或导入。
命令行
python cp2t.py -i -o [-t] [-d] [-f [text | html]]
i =输入文件(即PDF文件)o =输出文件t =它将尝试查找表(默认为False)d =调试(默认为False)f =输出格式(默认为文本)
输入
导入cp2t
输出= cp2t_v5.converte(_inputfile = nomefilein,_o
【文件预览】:
cp2t-master
----cp2t.py(26KB)
----README.md(1KB)