R-CNN 学习记录

CNN是一个运用卷积神经网络进行图片分类的开山之作。RCNN是第一个把图片分类和目标检测连接起来的作品。

RCNN主要解决的问题是：

1、怎样用深度神经网络进行目标定位；2、怎样用小批量的标注数据来训练一个大容量网络。

一、检测和分类的区别，就是多了一个框定位。作者的方法是：recognition using regions。

主要分三步：

1、对于一张图片，生成2000个proposal。和种类无关的子图。

2、对于每一个proposal，用CNN单独提取他们的特征。

3、对每一个特征，用SVM来做分类。

二、怎样用小批量标注数据训练大网络

先用大批量的无标注数据进行无监督训练。在此基础上，再用小批量的标注数据进行微调。

秒客网