前言:
前面我写过一篇关于pdf打印的文章http://blog.csdn.net/llxlqy/article/details/77148269#t4
这篇文章是对那篇文章的延续和拓展。
由于超新阅读器不支持目录迁移,所以我不得已自己手动输出目录。
现在有很多阅读器都支持添加书签等可以起到目录的作用,但这些需要一个一个的输入添加,效率非常差。我接下来的方法,虽然不能说是非常快,但和一个一个输入要快许多。
总的思路:
先得到pdf书的目录,再用工具把pdf书的接口文件导出,把书签目录信息批量输入,然后完成了。
第一步——得到目录信息
这一步可以采用很多方法:如果在网上能找到那最好。但往往很多目录找不到,然后超星阅读器里的目录又是扫描版的,无法编辑,那该怎么办呢???
OCR!!!
简单点说我就是希望把图像中的文字识别出来成为可以编辑的文本信息.
工具:wps(需要会员)
原料:带有目录信息的pdf
选择图片转文字
建议:一页一页的框出需要的然后在识别(一般有4,5页),不要一下子全部识别,那样效果不太好
最后保存为word文件。
第二步-------得到pdf接口文件
原料:带有目录信息的pdf
工具:FreePic2PDF
1.把之前保存的word里面的文字进行处理:注意格式
根目录(制表符)页码数
(制表符)一级目录 页码数
(制表符)(制表符)一级目录 页码数
比如:
第l章 Python入门 1
l.l Python的特点 l
1 . 1 . 1 面向对象 2
l.l Python的特点 l
1 . 1 . 1 面向对象 2
2.用FreePic2Pdf的【更改PDF】--->【从PDF取书签】把PDF书的接口文件导出来
3.用文本编辑器把接口文件中的FreePic2Pdf_bkmk打开,把第二步更改过的目录插入
4.用文本编辑器把接口文件中的FreePic2Pdf.itf文件中的BasePage=改为正文第一页所在的实际页数。
比如:正文第一页在PDF文件的第20页,所以改为BasePage=20
5.用FreePic2Pdf的【更改PDF】--->【往PDF挂书签】把第四步更改过的接口文件导入到PDF中
完成
谢谢大家