处理pdf文档
第一、
从文本中提取文本
第二、
创建PDF
两种方法
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
#使用PdfFileWriter
import PyPDF2
pdfFiles = []
for filename in os.listdir( '.' ):
if filename.endswith( '.pdf' ):
pdfFiles.append(filename)
print (pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
pdfFileObj = open (pdfFiles[ 0 ], 'rb' )
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end = map ( int , input ( '从多少页到多少页(用空格隔开):' ).split())
for pageNum in range (first - 1 ,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ( 'split_pdf.pdf' , 'wb' )
pdfWriter.write(pdfOutput)
pdfOutput.close()
|
1
2
3
4
5
6
7
8
9
10
|
#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [ str (i) + 'webbook.pdf' for i in range ( 0 , 124 )]
for i in a:
print (i)
merger.append( open (i, 'rb' ))
print ( "合并完成第" + str (i))
with open ( 'combintion.pdf' , 'wb' ) as f:
merger.write(f)
|
总结
以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!
原文链接:http://www.cnblogs.com/powercai/p/7787426.html