文件名称:cp2t:将PDF转换为TEXT(保留表)
文件大小:7KB
文件格式:ZIP
更新时间:2024-06-13 02:43:46
Python
CP2T:将PDF转换为文本(保留表) 关于 该程序使用一些现有工具将PDF转换为TEXT或HTML保留表 先决条件 需要的库: OpenCV( )-> OpenCV取决于numpy和scipy BeautifulSoup( ) 枕头( ) 临时文件 在Debian之类的版本中,“ apt-get install”将可以正常工作 安装 只需将cp2t.py复制到您的工作目录中 例子 它可以作为命令行或导入。 命令行 python cp2t.py -i -o [-t] [-d] [-f [text | html]] i =输入文件(即PDF文件)o =输出文件t =它将尝试查找表(默认为False)d =调试(默认为False)f =输出格式(默认为文本) 输入 导入cp2t 输出= cp2t_v5.converte(_inputfile = nomefilein,_o
【文件预览】:
cp2t-master
----cp2t.py(26KB)
----README.md(1KB)