本文实例讲述了Python输出PowerPoint(ppt)文件中全部文字信息的方法。分享给大家供大家参考。具体分析如下:
下面的代码依赖于windows com,所以必须在机器上安装PowerPoint才能用,可以将PPT文件中的所有纯文本信息进行输出到指定的文件,非常实用。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
import win32com
from win32com.client import Dispatch, constants
ppt = win32com.client.Dispatch( 'PowerPoint.Application' )
ppt.Visible = 1
pptSel = ppt.Presentations. Open ( "c:\\1.ppt" )
win32com.client.gencache.EnsureDispatch( 'PowerPoint.Application' )
f = file ( "c:\\1.txt" , "w" )
slide_count = pptSel.Slides.Count
for i in range ( 1 ,slide_count + 1 ):
shape_count = pptSel.Slides(i).Shapes.Count
print shape_count
for j in range ( 1 ,shape_count + 1 ):
if pptSel.Slides(i).Shapes(j).HasTextFrame:
s = pptSel.Slides(i).Shapes(j).TextFrame.TextRange.Text
f.write(s.encode( 'utf-8' ) + "\n" )
f.close()
ppt.Quit()
|
希望本文所述对大家的Python程序设计有所帮助。