pdfreader:适用于PDF文档的Python API

时间:2024-05-25 04:30:18
【文件属性】:

文件名称:pdfreader:适用于PDF文档的Python API

文件大小:2.59MB

文件格式:ZIP

更新时间:2024-05-25 04:30:18

Python

PDF阅读器 信息: 有关更多信息,请参见。 作者和维护者: Maksym Polshcha < > 请参阅以获取最新资源。 关于 pdfreader是一个Pythonic API,可用于: 从PDF文档中提取文本,图像和其他数据(纯文本或受保护的文本) 访问PDF文档中的不同对象 pdfreader不是一种工具(也许有一天会成为它!): 创建或更新PDF文件 将PDF文件拆分为页面或其他部分 将PDF转换为任何其他格式 但是,它可以用作此类工具的一部分。 请参阅。 特征 提取文本(纯文本和带格式的文本对象) 提取PDF表单数据(纯字符串和格式化的文本对象) 支持所有PDF编码,CMap,预定义的cmap。 将图像和图像蒙版提取为 支持加密和受密码保护的PDF文档 允许浏览任何文档对象,资源并提取您需要的任何数据(字体,注释,元数据,多媒体等) 遵循 懒对象访问允


网友评论