在ssd检测中,有一个重要的功能就是物体框的回归,接下来我来说一下ssd是怎么进行边界框回归的。
首先上图
我们观察图中狗的边框,其中黑色的是真实框(预先人为标定的),红色的为预测框(ssd最后预测的结果),黄色的为先验框(形成预测框的,首先得到的框)。
通俗的来说一下,我们经过6层不同大小的featmap后,会有很多的候选框,论文中一个类别有8732个,我们选取与真实框IOU最大的候选框作为先验框,然后以真实框为标准进行回归。
我们以cx、cy、w、h来作为框的位置信息,分别为框的中心点、宽与长。
T代表真实框(Ground Truth),P代表先验框(bounding box),G代表P经过边框回归后的预测框,所谓边框回归也就是指P经过调整成为预测框的过程。
首先要明白P与T的大小、形状、位置都有差别,直接上来就让P根据T做回归是比较困难的,所以我们先将P做一些缩放、平移,然后在与T做回归(回归就是做梯度下降,4个点的)梯度下降。
指的是真实框的位置数据,是先验框的位置数据,是预测框的位置数据。
接下来是变幻的公式:
预测框计算结果公式:
最终我们通过梯度下降来改变这四个值进行回归。