pdf转chm的实现方法

时间:2024-02-19 08:56:11

相比pdf, CHM电子书在Windows系统下不需要安装额外的浏览器即可进行阅读,其内容是基于浏览器的风格,更容易被用户所接受。而且, 具有更强大的功能配置,比如可提供强大的全文搜索、索引、书签等的功能。

那么如何将pdf转chm格式的电子书呢?  具体实现方法如下:

1. 用 convert 命令,将pdf按页转为图片。

2. 用 pdftotext 命令, 提取每页pdf的文字存为 txt 文件。

3. 写个脚本将 图片 和 txt 文件 转为html 文件, 其中txt 部分在html隐藏, 主要用于实现检索功能。

4. 用chm编译工具,见html文件编译成chm文件。

 具体实现: https://github.com/uniqid/codebase/tree/master/pdf2other