因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。例如,卷积层输出的特征图中两个相连的点的特征通常会很相似,假设a[0,0],a[0,1],a[1,0],a[1,1]都表示颜色特征是红色,没有必要都保留作下一层的输入。池化层可以将这四个点做一个整合,输出红色这个特征。可以达到降低模型的规模,加速训练的目的。
参考UFLDL中的池化概念:
http://deeplearning.stanford.edu/wiki/index.php/%E6%B1%A0%E5%8C%96
另外:UFLDL中关于“卷积特征提取”的概念:
http://deeplearning.stanford.edu/wiki/index.php/%E5%8D%B7%E7%A7%AF%E7%89%B9%E5%BE%81%E6%8F%90%E5%8F%96
最后还有对C++实现的CNN代码的详细解释:
http://blog.csdn.net/column/details/tiny-cnn.html