CNN的输入图像尺寸问题

时间:2024-04-05 14:11:56

输入图片的大小需要固定

我们知道CNN输入图片的大小需要固定,但是这是为什么呢?
其实在网络结构中卷积层是不需要固定图像的大小(它的输出大小是跟输入图像的大小相关的),一般情况下输入尺寸都会大于常用的卷积核大小。有固定输入图像大小需求的是全连接部分,全连接部分的参数的个数是需要固定的。

解决方案

当然可能我们的数据集的大小并不统一,这时候就需要进行处理了
1.可以在输入网络之前进行resize,将图像全部resize成统一大小。
2.可以在网络的数据层设置crop_size参数,该部分是的意思是对原图进行裁剪。

crop_size

crop_size的意思是裁剪,在训练和测试两种情况时的裁剪方案是不一样的。代码请看src/caffe/data_transformer.cpp
CNN的输入图像尺寸问题
意思是如果设置了crop_size参数则有两种裁剪方案。
1.训练:随机裁剪
2.测试:裁剪中间部分

参考:https://blog.csdn.net/u011762313/article/details/48343799