来源于公众号 智能感知与计算研究中心:“谁动了我的图片?” – 图像取证技术
它是一种有效的检测篡改的手段。不同于数字水印这种主动的版权保护措施,图像取证不需要往原图像里添加额外信息,不会对原图造成影响。由于它是一种被动的检测技术,因此其应用范围更加广泛。
之所以叫“取证”二字,是因为检测图像篡改就像是侦探破案一般,需要从各种蛛丝马迹上搜集有用的证据。正如作案的凶犯绝不会在案发现场留张纸条写着“凶手就是我xxx”,图片的篡改者一般也不会留下很明显的篡改痕迹。因此,图像取证所依赖的蛛丝马迹都是一些微弱信号,往往不易令人察觉,但它们往往随着成像过程和篡改过程而留在了图像上面。图像取证就是要捕捉到这些微弱的痕迹来证明图像的真伪。本文就为大家介绍一些有趣的“案例”。由于“案例”数量众多,“作案手法”各不相同,“蛛丝马迹”也形形色色,故只挑选一部分代表性的“经典案例”进行讲述。
.
1. “欲盖弥彰”—copy-move检测
上图左为原始图片,比如是小明家后院的军车。现在小明想把图片发到朋友圈稍稍显摆下,但是又不想太暴露,所以他用PhotoShop把图片中一辆车用一大片树叶遮盖住了。本以为这样就可以把敏感内容掩藏,何曾想这样会引入新的痕迹—两片完全相同的叶子(上图右红圈所示)。莱布尼茨他老人家看到“世界上有两片完全相同的树叶”不知会不会醒来。
Copy-move 检测就是针对这种痕迹进行取证,其基本原理就是利用计算机视觉算法来寻找相似的图像内容区域。如果能够在同一副图像中检测到大块的相同内容,就会判定该图像遭受过copy-move 篡改。其具体的技术手段可分为基于稀疏特征点(如SIFT)和基于图像块的图像匹配算法。用一种基于特征点的检测方法来检测上图的篡改图像便会得出下图的效果:
可见,copy-move 检测算法是可以准确的找出这两片“相同的树叶”。所以想通过这种手段篡改图像的小明可得长点儿心了。
.
2、“揠苗助长”—像素重采样检测
小明终于出来了,朋友们一起聚会庆祝。期间小明和大明来了张合影,但问题是大明真的比小明高很多。小明觉得倍儿没面子,于是再次发挥PS神技,把相片里的自己放大了n倍,然后开心地发到朋友圈炫耀。怎知这种“揠苗助长”的行为,还是无法逃出砖家的法眼,大明听了砖家的话,从此和小明绝交。
砖家用到的就是像素重采样检测这种技术。所谓像素重采样就是像素插值,也就是“无中生有”造出新的像素来。我们知道数字图像是由一个个紧密排列的像素点阵构成的,当小明把自己的图像放大好多倍的时候,一个显然的问题就是:图像的面积变大了好多,于是原来紧密排列的像素点阵之间产生了许多空挡。而这种空挡就由其四周的像素值进行插值来填补了,常见的插值算法有双线性插值、双三次插值等。无论哪种插值算法都会使插值产生的空挡位置与其四周的原像素产生一种相关性,利用这种特有的相关性就可以判断一副图像是否经过缩放、旋转等操作了。
如上图所示,把第一幅图放大30%后得到第二幅图,利用最大期望(Expectation Maximization)算法估计图中每个像素点被插值产生的概率得到第三幅图。第三幅图中包含着与放大倍数相关的周期性,这种周期性通过傅里叶分析可以在频域图(第四幅)中观察到,其现象就是箭头所指的4个高频亮点。这种取证方法通过分析邻近像素间的相关性可以检测由于图像缩放而产生的像素插值,揠苗助长的小明又学到了一课,准备回家恶补,提高自己的篡改技能。
.
3、“明镜高悬”– 反射不一致性检测
小明觉得自己学得差不多了,闲来无事,又制作了一张PS图片发到了网上,造谣称福岛核辐射产生的变异巨猫正在东京街头肆虐,唯恐天下不乱,一时引起了轩然大波,民众十分恐慌。本想这次的合成图制作的天衣无缝,连巨猫的反射影子都P到了大楼的幕墙上了。他还真是图样图森破啊,何曾想由于自己缺乏射影几何知识,再次被砖家找出破绽。
这次使用的是基于几何约束的取证方法:物理场景成像所用的小孔相机模型遵从摄影几何的规律,所有违反这些规律的图像都是不可能出现的。在上面这副假图像中,由于玻璃幕墙的存在,大猫在镜子里是有影子的。基本物理知识告诉我们,物体上的点和镜子里的像点之间的连线是垂直于镜面的,而镜面是一个平面,所以所有上述物体点和像点的连线是相互平行的。射影几何知识进而告诉我们:成像场景中的一组平行线成像后在照片上是一组相交的直线,其唯一的交点叫做消隐点。按照这个规律,取证专家可以把照片中的很多物体点和相应的反射像点连成直线,看这些直线是否相交于唯一一个消隐点。其效果可见下图:
可以看到:绿色和蓝色的连接线相交于同一个消隐点,而当把消隐点与大猫身上的物体点相连后(红线)发现这些直线并不经过镜子中相应的猫的像点。喵星人的照片违反了射影几何的规律。明镜高悬,小明下次伪造有镜子的图像时可要小心点儿喽。
.
4、 “光怪陆离”—光照一致性检测
多次被挫败的小明还是不死心,非要整出个噱头来。这次他用PhotoShop把自己和著名电影明星安妮.海瑟薇拼接到了一起,并再次把这张“合影”晒到了朋友圈来炫耀。当当当当。。。。小明又被砖家揭穿了。这次采用的取证线索是光照的不一致性。
我们知道每个照片场景都有自己独特的光照环境。每个场景的光照方向往往不尽相同,而把两个不同场景下的照片拼接到同一幅图中的时候,各个物体所携带的光照痕迹就可以被抽取出来用作取证。正如上面这张假“合影”,我们可以发现两张人脸的光照方向有着明显的差异。为了让计算机能够自动地估计照片中各个物体所处的光照环境并判别其一致性,取证专家们开发了算法,通过检测照片中的人脸,检测人脸关键点,拟合三维人脸模型,估计光照参数,计算光照参数间的差异性等一系列流程来自动判别图片的真假。
上图中两个球体指示两张脸的光照方向一个来自右边,另一个来自左边。所以这张图片又被砖家认定为假图片。魔高一尺道高一丈,无奈的小明只能望洋兴叹了。
除了上述列举的5种技术外,图像取证其实还有很多其他的手段。从基于像素、压缩格式到基于相机,再从基于几何约束到物理的光影约束,称得上是八仙过海各显神通。虽然如今的图像篡改手段五花八门,越来越先进、逼真,但是图像取证技术也是日新月异,不断发展之中,可谓是兵来将挡水来土掩。两种相对的技术相生相克并相互促进,相信取证技术在未来的信息安全中一定会扮演更加重要的角色。