yolo:
通过聚类产生5个不同比例的anchors.最后一个特征层的输出(x,y,w,h)与这些不同比列的相乘,将网络层的输出转化为bbox(小尺寸),再通过(H,W)还原成原图大小。一共有5个bbox。最后选出与gt box IOU最大的那个与gt做回归。
faster rcnn:
直接在最后网络层输出的那个点上产生9个anchors,选出最大的iou与gtbox 做回归。
yolo:
通过聚类产生5个不同比例的anchors.最后一个特征层的输出(x,y,w,h)与这些不同比列的相乘,将网络层的输出转化为bbox(小尺寸),再通过(H,W)还原成原图大小。一共有5个bbox。最后选出与gt box IOU最大的那个与gt做回归。
faster rcnn:
直接在最后网络层输出的那个点上产生9个anchors,选出最大的iou与gtbox 做回归。