PDF压缩-浅谈pdf书籍的瘦身

时间:2021-04-10 00:44:05

在52ebook有篇很好的帖子,讲对e书的减肥,但pdf书籍更需要进行瘦身,因为pdf书籍实在是太大了,几十兆的书籍太常见了。甚至达到上百兆,占用宝贵的硬盘空间,占用宝贵的网络空间,所以这里就讲讲我本人是如何对pdf书籍进行瘦身处理的,只是班门弄斧,请高手不要见笑。

必需软件:adobe acrobat professional(我用的是7.0,用8.0的朋友可以说说8.0的使用效果啊)

pdf书籍可以分为两类:文本pdf与影印pdf.

先说说对所有pdf均适用的方法:
1 最方便快捷的方法,直接点击文件菜单下,选择另存为,然后保存即可。可以不更改文件名,直接覆盖保存。速度快,但减掉的体积有限。 我用这种方法,对《失落的文明》那套书进行了处理,一般每本书都可以砍掉4-5兆,个别书砍掉的更多。(原书每本是几十兆)
2 点击文件菜单,选择减小文件大小,选择另存为,再保存即可。与上一方法相似,速度要慢些,但砍掉得体积也更多些。
3 点击高级菜单,选择pdf优化器,就会跳出个很大的窗口,用于对pdf书籍的各个指标进行优化,可以自行配制。配制完后,确认保存即可。这种方法很慢,特别是几十兆的大型文档是更是如此,但也是效果最好的,砍掉得体积多达30%-50%。


对于影印pdf还有一种方法,就是转换书籍格式,由pdf格式转成djvu格式。上述方法虽然适用于所有pdf文档,但对影印pdf书籍来讲,压缩体积还是有限的,而djvu无疑是影印图书的最佳压缩方式,通常可以比pdf节约一半的体积。一般说来,每100页书籍,djvu格式大概占用1兆到2兆。就是说,如果一本书有400页,那么扫描成djvu书籍后,其体积在4兆到8兆之间,压缩率是比pdf高很多的。我将原本是20多兆的一本清晰版pdf书籍,转换成了djvu格式,体积只有1兆多,而清晰度没有降低。(我在影印pdf图书版发布了这本书,《古书句读释例》,大家可以自行比较。)
转换方法:
1 并不是所有的影印pdf书籍都适宜转换。如果pdf书页面有多个图层,或有多幅插图,特别是彩图,就不要转换了。主要针对的是黑白图书,彩版图书不适用。
2 点击高级菜单,选择导出所有图像,然后保存为tiff格式的图片。最好先建一个同名文件夹保存这些图像。
3 对导出的所有图片重命名。我用的是BatchRename 3.12批量重命名软件,把所有图片重改名为从1开始递增的8位数。(这步也可以省略,但有时会出错)
4 使用软件Ducument Express Enterprise,对所有的图片打包成djvu文档。(封面不要包含在内,彩页tiff图像转换成djvu会变模糊,而用虚拟打印则不会)
5 一般封面要单独处理,可以用djvu虚拟打印机打印成djvu文档,然后再与已经制作好的djvu图书重新打包。
6 最后用djvu editor制作书签。

对于pdg格式的超星图书,可以直接用老马软件Djvutoy转成djvu格式。readfree有售。

附带说一句,阅读djvu格式的工具最好用WinDjview,这是个免费的绿色软件(如果不要语言包,则只有一个文件),阅读djvu图书的感觉要比pdf好一些,影印版pdf书籍太笨重了。

当然如果pdf本身是用黑白二色CCITT G4格式的tif为材料的,则除了缩减图片尺寸之外,没有任何有效的pdf瘦身法。在这种情况下,即使是DjVu也没有多大的能为,常见的制作尺寸至多(也就是深度优化之后,以不损失质量为前提)减少1/5-1/4的体积,而对于超高分辨率的制作(600+ dpi或者大尺寸的书如辞海词源),瘦身效果会更强些,可以超过1/3。

能大大缩减体积的pdf优化及DjVu转制,唯一的可能是PDF文件所用材料为灰度图甚至是真彩图片。

Acrobat本身的所谓优化,无非是在图片的压缩方式(是高质量Jpeg还是高压缩)或者图片尺寸上玩点花样,基本上都是以损失图像质量为前提的。——一般的屏幕阅读可能察觉不出来,用来打印就知道差别了。

至于楼主所说存一下即可减肥若干M的,只是因为原文件制作时间较早,所用的格式(及算法)比较老。存了一下之后改用新格式了而已。


总之,要有效的缩小PDF文件的体积而不损失质量,还是要有些图像处理的知识和经验的,初学者须谨慎从事。