文件名称:pdfminer.six:pdfminer的社区维护分支-我们了解PDF
文件大小:9.94MB
文件格式:ZIP
更新时间:2024-05-17 19:10:47
pdf parser Python
pdfminer.six 我们了解PDF Pdfminer.six是原始PDFMiner的社区维护的分支。 它是从PDF文档中提取信息的工具。 它着重于获取和分析文本数据。 Pdfminer.six直接从PDF的源代码中提取页面中的文本。 它也可以用来获取文本的确切位置,字体或颜色。 它以模块化方式构建,因此可以轻松替换pdfminer.six的每个组件。 您可以实现自己的解释器或呈现设备,该解释器或呈现设备将pdfminer.six的功能用于文本分析以外的其他目的。 请文档”上的完整。 特征 完全用Python编写。 解析,分析和转换PDF文档。 PDF-1.7规范支持。 (嗯,差不多)。 CJK语言和垂直书写脚本支持。 支持各种字体类型(Type1,TrueType,Type3和CID)。 支持提取图像(JPG,JBIG2和位图)。 支持RC4和AES加密。 支持