R-CNN 学习记录

时间:2023-03-09 16:31:14
R-CNN 学习记录

CNN是一个运用卷积神经网络进行图片分类的开山之作。RCNN是第一个把图片分类和目标检测连接起来的作品。

RCNN主要解决的问题是:

1、怎样用深度神经网络进行目标定位;2、怎样用小批量的标注数据来训练一个大容量网络。

一、检测和分类的区别,就是多了一个框定位。作者的方法是:recognition using regions。

主要分三步:

1、对于一张图片,生成2000个proposal。和种类无关的子图。

2、对于每一个proposal,用CNN单独提取他们的特征。

3、对每一个特征,用SVM来做分类。

二、怎样用小批量标注数据训练大网络

先用大批量的无标注数据进行无监督训练。在此基础上,再用小批量的标注数据进行微调。