文章目录
- 解决方案
- 转换方式对比
- pandoc
- Word
- Adobe Acrobat
- 转换细节
- 公式
- 表格
- 插图
解决方案
- 公式部分建议首先尝试使用pandoc转换
.tex
源文件为Word - 表格部分建议首先尝试Adobe Acrobat转换
.pdf
生成文件为Word - 通常情况下可以尝试直接使用Word打开
.pdf
生成文件
转换方式对比
效果对比仅针对排版布局、插图、表格、公式部分,其余未讨论部分默认在多种转换方式下无明显区别。
pandoc
- 排版布局上可能存在部分内容丢失,主要排查方向是调用第三方包和排版复杂度
- 插图可以保持,但排版丢失
- 表格混乱
- 公式几乎完美转换
总结:使用pandoc
转换.tex
为.docx
更适用于多公式文档。
Word
- 排版布局上,字体字号等文档设置均发生变换,且行间距可能因为某些原因发生变化
- 插图有部分缺失,但排版可以保持
- 表格有一定的识别成功率,但可能解析为图片格式
- 公式识别成功率较低,但易于修正
总结:使用Word直接打开生成的.pdf
文档可以得到最容易二次修改的.docx
文档,因为缺失插图可以直接从源文件中重新载入,而公式部分可以借助pandoc
的转换结果,排版部分工作量不大,表格部分依赖排版复杂度。
Adobe Acrobat
- 排版布局几乎可以保持
- 插图几乎可以保持
- 表格几乎可以转换
- 公式识别成功率低,可能还不如使用
Word
打开的方式,甚至可能影响转换后文档布局
总结:如果文档排版简单,公式少,几乎可以实现完整转换
转换细节
公式
使用pandoc
实现.tex
到.docx
的转换
$ pandoc -o
表格
- 首先尝试Adobe Acrobat
- 其次尝试使用Word直接打开
- 还不行?尝试单独对表格源码进行转换
插图
-
Adobe Acrobat
几乎可以完美保持,如果条件允许请一定尝试。