【文件属性】:
文件名称:word源码java-WordSolver:python处理word文档案例-列出修订点
文件大小:4KB
文件格式:ZIP
更新时间:2021-06-05 23:00:04
系统开源
word源码java
title
date
tags
python处理word文档案例-列出修订点
2019-10-30
05:18:56
-0700
python
word
BeautifulSoup
项目背景
最近一个“大法师”朋友找到了我,问我能不能帮他做一个小程序,需要将word文档中的修订内容(如下图1)都统一做成如下形式,生成修订表(如图2)。
图1
原文件
图2
生成的修订表
需求分析
实现方式
因为本人是典型的java程序员,也会一点点python。在网上找到的资源,只有一个修订方式是批注的解决方法,不包含其他的修改类型(比如:新增,删除,移动,格式)。
目前网上找到的解决方案有如下几种:
1.通过VB或者宏程序处理;
2.通过解析word的xml去处理。
第一种方式是最简单的,但是因为对这方面不太熟悉,而朋友又急着要,因此这个方案先抛弃了。
下面着重讲解通过解析word的xml来实现这个效果的思路。
开发前的准备
1.将原文docx文档,通过更改后缀为zip,将里面的xml文件拿出来。(主要用到的是document.xml,styles.xml)
2.准备好开发环境:
【文件预览】:
WordSolver-master
----README.md(4KB)
----Test.py(5KB)