PDF文件的书签批量自动导入和导出 PDFBookmark-Exchanger

时间:2024-04-14 12:04:14

PDF文件的书签导入和导出 PDFBookmark-Exchanger

摘要

    PDF电子书是最流行的格式,可以注释可以带书签目录方便阅读。本文介绍了这个软件用于PDF书签的导入、导出、交换。

并提供了物理学、微积分的示例PDF书籍供参考。

此软件需要操作系统安装有JDK或者JRE方能运行, Oracle的官方下面地址点这里JDK

1 前言

PDF文件全称portable document format,就是便携文档格式,是所有平台都支持浏览的文档格式。无论你用什么系统,你的屏幕显示和打印输出就是发布者想要的样子。此即“输出一致”。
在文档打印、论文撰写、信息交流,已经电子书阅读方面,PDF文档使用的越来越普遍。
PDF文件的书签(或者大纲-Outline) 提供了文档的组织结构,阅读文档时非常方便。
然而,很多PDF书籍没有书签,而书签功能又是如此重要,比如:
  • 书签导入: 我们经常可以在amazon, JD或者出版社网站上浏览到相应书籍的书签,怎么将这些书签导入相应的PDF文件呢?
  • 书签导出:  从已经有书签的PDF文件中导出书签
  • 书签交换: 同一本书籍的2个不同PDF文件,清晰的文件没有书签,而不清晰的文件则带有书签,怎么方便的在PDF文件之间转移书签呢?
对于上述的三个简单功能,在网上始终未找到软件能较好提供这些功能,因此自己实现了下述软件: PDFBookmark-Exchanger


2 PDFBookmark-Exchanger

软件基于Java进行开发,可以实现跨平台使用。运行软件必须安装有JRE(Java运行时环境)。软件界面如下:
 
1) Load: 加载PDF文件并导出书签
2) Save: 将书签导入到PDF文件中
3) Open: 打开Text(文本文件)中的书签内容
4) Store: 保存当前书签内容到文本文件中
5) 书签页码对应关系设定: 设定书签的页码和实际PDF文件页码的对应关系,默认为1对1

PDF文件的书签批量自动导入和导出 PDFBookmark-Exchanger

3 书签的格式

欲导入和导出的书签格式规定如下:
1) 每一行代表一个书签

2) 空行#字符开头的部分做为注释,被自动忽略

3) 每行书签的格式为: 【0或者多个缩进】【书签名】【多个空白字符】【页码】

  • 书签缩进: 以Tab键或者连续4个空格键或者中文全角空格作为一个子书签缩进,依次类推
  • 书签名: 不能含有3个及以上空格或者Tab键或者#字符
  • 书签名和页码的分隔:至少一个Tab键或者连续4个空格或者连续2个全角空格及以上做为分隔标记

4) 如果书签内容保存到Text(文本文件)中,则文件必须以UTF-8编码存储



PDF文件的书签批量自动导入和导出 PDFBookmark-Exchanger

4 操作建议

以导入书签到PDF文件中为例。
1) 首先从网上找到到书签内容, 如果有页码最好,否则需要自己输入页码。
2) 输入页码: 将书签内容拷贝到Excel文件中,每行代表一个书签,然后在另外的列中输入书签对应页码
3) 将书签及页码拷贝到文本编辑器中,例如: Editplus, Notepad++等,使用这些编辑器提供的列选模式,调整缩进和分隔符合上节中的书签格式
4) 书签的页面往往从1开始,而实际的PDF文件因为包含书籍封面等信息,真实页面和书签页码之间有偏移,打开PDF文件,看看书签中的页面和对应的实际页码是多少,填入软件中。
5) 点击”Save”按钮即可导入PDF文件中。


5 软件下载及示例



PDFBookmark-Exchanger 链接:https://pan.baidu.com/s/1jIeTsUy 密码: i5un
(下载后,windows环境点击“run.bat”, Linux环境运行 “run.sh”即可启动软件)

用此软件制作的带书签PDF文件: (选择后背景反白即可见到提取码)
(下面的电子书仅做研究之用,请于下载后24小时删除!)

物理学教科书等(书签带目录): 链接: https://pan.baidu.com/s/1zbuPrL9Fj6NDwuf_IwSwXw 密码: gemg


[email protected]道//理==论==物理教程(朗道十卷) (书签带目录): 链接:https://pan.baidu.com/s/1c8U7wE 密码:bdtt


托拖-马码-斯师-微积分等(书签带目录) 链接:https://pan.baidu.com/s/1boUX2Rd 密码:vnqt