一、论文
(19)Training Region-based Object Detectors with Online Hard Example Mining
https://arxiv.org/abs/1604.03540
二、论文笔记
1、背景
(1)、现存的网络的启发式方法和超参数需要花费很多时间去调。
(2)、数据集的样本有很多简易样本,以及一小部分的困难样本。
(3)、传统的bootstrap(SVM)方法很难与目前的目标检测算法相结合
2、创新点
(1)、提出了online hard example mining(OHEM)
优点:
a)、它消除了在基于区域的ConvNets中常用的几个启发式和超参数的需要。
b)、mAP产生了一致的提升
c)、随着数据集变大变困难,效果会更好
流程:
把输入图片的所有的ROI都进行(比如说在fast rcnn中不再是抽样2000个),下一阶段的前向传播,然后根据每个ROI的损失排序,选取前多少个ROI的损失进行反向传播。这里有个问题,重叠程度高的ROI,有可能都被选中,因此使用NMS根据IOU过滤掉一些
具体实现:
具体实现,一个直接的想法就是,把没有被选中的ROI的损失置为0,然后所有ROI的一起反向传播,这样还是需要向所有的ROI分配内存
所以作者提出了使用两个子网络,一个用来全部ROI前向传播,然后选出来候选地ROI,然后再在另一个子网络上进行前向和反向传播,更新参数,当然来两个子网络的参数是共享的。
见图:
具体的参数
n是mini-batch的图片数,R是a网络的roi数,B是b网络的roi数
3、细节
(1)、
(2)、
4、实验
(1)、
(2)、