论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks

时间:2024-03-15 13:08:46

Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks(利用空间变化循环神经网络对动态场景去模糊)

这是CVPR2018的一篇论文,主要介绍的是单图去动态模糊,

概述&提出方法

       由于相机抖动,景深和物体运动,动态场景去模糊是空间变化的。已有的利用先验图像信息或者庞大的深度神经网络的方法无法有效地处理这个问题,同时他们计算开销很大。与已有的方法不同,作者提出一个空间变化的神经网络来解决动态场景去模糊。作者提出的算法包含了三个卷积神经网络和一个循环卷积神经网络。其中卷积神经网络用来提取特征,学习循环卷积神经网络的系数和图像重建。在卷积神经网络抽取的特征指引下,循环卷积神经网络恢复出清晰的图像。作者的分析表明,该算法具有较大的接受范围,同时模型尺寸较小。与此同时,本文分析了空间变化循环卷积网路和反卷积的关系。分析表明空间变化循环卷积网络能够对反卷积建模。作者以端到端训练的方式,提出一个较小的深度学习模型,其速度优于已有的方法。在标准数据库上定量和定性的评估表明该方法在精度,速度和模型大小方面优于已有的方法。

问题

       目前去模糊的方法主要存在如下的问题,首先CNN的权重是空间不变的,这样就不能对具有很强动态性的各种blur进行消除。其次就是即使模糊区域很小,也需要较大的感受野,造成计算资源浪费。因此,这里提出使用RNN进行deconv的操作,而RNN的权重是通过CNN学习得到的,这样就可以针对不同的模糊deblur。
   论文首先证明了,RNN可模拟一个IIR过程用于去噪(看不懂~~~)。然后说明,在RNN之间加入CNN,不同方向的信息可以融合,从而考虑到2D信息的作用,并且可以利用RNN获得非常大的感受野。RNN的动态核和传统去模糊也比较像,针对不同的模糊使用不同的核去恢复。

网络结构

 网络结构如下图所示,包括特征提取,RNN权重生成部分,RNN deconv和图像重建这几个部分。首先用两个CNN层提取特征,然后下采样减少计算量。每一个RNN有四个方向,每个RNN后面加上一个CNN融合四个方向的信息。使用一个14层的CNN去生成RNN的权重,该CNN最后使用tanh函数使得权重限制在0到1之间,最后使用双线性插值对特征进行上采样。

论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks

空间变化循环神经网络包括四个部分:特征提取网络,权重生成网络,RNN(包括RNN之间的卷积层)和图像重建网络。

实验结果

论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks

论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks

论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks 

论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks 

论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks 

定量和定性的评估表明该方法在精度,速度和模型大小方面优于已有的方法。

Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks:https://www.cs.cityu.edu.hk/~rynson/papers/cvpr18c.pdf

code:https://github.com/zhjwustc/cvpr18_rnn_deblur_matcaffe