【PDF合并】利用 Python 合并 PDF 文件

时间:2024-03-08 14:42:28

依赖安装

pip install PyPDF2

在 Python 中,可以使用 PyPDF2 模块来合并多个 PDF 文件。

from PyPDF2 import PdfFileMerger

# 创建一个 PdfFileMerger 对象
merger = PdfFileMerger()

# 添加要合并的 PDF 文件
pdf_files = ['file1.pdf', 'file2.pdf', 'file3.pdf']
for pdf_file in pdf_files:
    merger.append(pdf_file)

# 指定输出文件路径
output_path = 'merged.pdf'

# 执行合并操作
merger.write(output_path)

# 关闭 PdfFileMerger 对象
merger.close()

首先导入 PdfFileMerger 类。接下来,创建一个 PdfFileMerger 对象 merger。

然后,使用 append 方法逐个添加要合并的 PDF 文件。在示例中,将要合并的 PDF 文件路径存储在列表 pdf_files 中,可以根据实际情况进行修改。

在添加完所有的 PDF 文件后,需要指定合并后的输出文件路径 output_path。

最后,调用 write 方法执行合并操作,并使用 close 方法关闭 PdfFileMerger 对象。

执行上述代码后,将会生成一个名为 merged.pdf 的文件,其中包含了所有合并的 PDF 文件的内容。

如果提示

PyPDF2.errors.DeprecationError: PdfFileMerger is deprecated and was removed in PyPDF2 3.0.0. Use PdfMerger instead.

则是由于

在 PyPDF2 版本 3.0.0 中,PdfFileMerger 类被移除了,取而代之的是 PdfMerger 类。

from PyPDF2 import PdfMerger

# 创建一个 PdfMerger 对象
merger = PdfMerger()

# 添加要合并的 PDF 文件
pdf_files = ['file1.pdf', 'file2.pdf', 'file3.pdf']
for pdf_file in pdf_files:
    merger.append(pdf_file)

# 指定输出文件路径
output_path = 'merged.pdf'

# 执行合并操作
merger.write(output_path)

# 关闭 PdfMerger 对象
merger.close()