深度学习基础知识之Atrous卷积(空洞卷积)

时间:2024-03-13 09:19:23

太久不看代码确实生疏了,盯着一堆不同的dilation,不知道有什么作用,论文中说是Atrous卷积,原来就是空洞卷积的意思。
Dilated/Atrous Convolution 空洞卷积(膨胀卷积/扩张卷积)
空洞卷积是一种不增加参数量/运算量,同时增加输出单元感受野的一种方法,Atrous卷积,就是带洞的卷积,卷积核是稀疏的,此外,空洞卷积还可以捕捉多尺度上下文信息,通过设置不同的dilation rate,感受野就会不一样,也即获取了多尺度信息,多尺度信息在视觉任务中相当重要。

最初是在语义分割中提出来的dilation convolution,是为了解决FCN思想的语义分割中,输出图像的size要求和输入图像的一致需要upsample,但由于FCN中使用pooling操作来增大感受野,同时降低分辨率,导致upsample无法还原由于一些pooling导致的细节损失问题,为了减小这种损失,自然需要移除pooling层,因此空洞卷积应运而生。
在这里插入图片描述
简单来说,就是在原本实心的kernal元素之间按照一定的规律加0作为空格