CNN学习笔记之LeNet-5模型各层参数理解

LeNet-5 模型是Yann LeCun 教授于1998年在论文《Gradient-based learning applied to document recognition》中提出的，它是第一个成功应用于数字识别问题的卷积神经网络。在 MNIST 数据集上，LeNet-5 模型可以达到大约99.2%的正确率。LeNet-5 模型共有7层，如下图所示：

第1层卷积层

输入图片尺寸：32x32x1；
输出图片尺寸：28x28x6；（filter=5*5, strides=1, padding='VALID'）
卷积层参数：5x5x1x6+6=156个参数，其中6个为偏置参数；
卷积层连接：(5x5+1)x28x28x6=122304个连接。

第2层池化层

输入图片尺寸：28x28x6；
输出图片尺寸：14x14x6；（filter=2*2, strides=2, padding='SAME'）
池化层参数：2x6=12个参数；
池化层连接：(4+1)x14x14x6=5880个连接。

第3层卷积层

输入图片尺寸：14x14x6；
输出图片尺寸：10x10x16；（filter=5*5, strides=1, padding='VALID'）
卷积层参数：(5x5x3+1)x6 + (5x5x4 + 1) x 3 + (5x5x4 +1)x6 + (5x5x6+1)x1 = 1516个参数；
卷积层连接：1516x10x10=151600个连接。
Note: C3的前6个特征图以S2中3个相邻的特征图子集为输入。接下来6个特征图以S2中4个相邻特征图子集为输入。然后的3个以不相邻的4个特征图子集为输入。最后一个将S2中所有特征图为输入。这样C3层有1516个可训练参数和151600个连接。

第4层池化层

输入图片尺寸：10x10x16；
输出图片尺寸：5x5x16；（filter=2*2, strides=2, padding='SAME'）
池化层参数：2x16=32个参数；
池化层连接：(4+1)x5x5x16=2000个连接。

第5层卷积层（实质上因为滤波器大小为5x5，等价于全连接层）

输入图片尺寸：5x5x16；
输出图片尺寸：1x1x120；
卷积层参数：(5x5x16+1)x120=48120个参数；
卷积层连接：(5x5x16+1)x120=48120个连接，与参数大小一致。

第6层全连接层

输入图片尺寸：1x1x120；
输出图片尺寸：1x1x84；
全连接层参数：(120+1)x84=10164个参数；
全连接层连接：(120+1)x84=10164个连接，与参数大小一致。

第7层全连接层

输入图片尺寸：1x1x84；
输出图片尺寸：1x1x10；
全连接层参数：(84+1)x10=850个参数；
全连接层连接：(84+1)x10=850个连接，与参数大小一致。

秒客网

CNN学习笔记之LeNet-5模型各层参数理解

相关文章