SSD与YOLO及faster-RCNN的改进特点(目标检测)

时间:2020-12-23 11:18:09

作者:峻许
链接:https://www.zhihu.com/question/50910763/answer/139070515
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Faster R-CNN 分成了两个阶段:区域提名,细化分类,而SSD就一气呵成.
通俗地讲,是有一位老人在中国南海画了一个圈,,呃,偏了,
通俗地讲,他们都是在原图上预先画了很多个框框,然后判断这些框框是不是前景.这和传统的滑窗有点像,anchor代表了不同size和比例的滑窗.但feature map的感受野更大一点,特征提取的也更好.
总的来说,SSD和rpn相似
rpn二分类,是在conv4 这一层feature map先加上3x3的卷积(经评论区指正)再进行1x1的卷积生成512-d或256-d的向量判断当前9个anchor是不是有Object.
SSD细分类,然后会在多层feature map上面预测,预测预先确定好了’anchor’是什么Object.弥补了yolo只在最后一层分成7x7的框,捡了许多漏检的.而且是很多,最新的ssd512捡了更多.
另外,在训练的时候,SSD按照默认的配置训练起来很慢,而且用resnet提升不高,但是需要24g显存,(ssd500,这导致直接被管理员kill了,郁闷!).ssd在预测上面确实比较快,0.28秒一张(TITan X)
在小物体预测上面,faster rcnn比ssd,yolo要好.最近yolov2出了,之前一直被吐槽的性能好了很多,速度也快,题主可以玩玩,比纯faster rcnn+resnet 还好了.单看论文名字就知道很厉害.
YOLO9000: Better, Faster, Stronger
arxiv: https://arxiv.org/abs/1612.08242
code: http://pjreddie.com/yolo9000/
http://nooverfit.com/wp/%E6%9C%BA%E5%99%A8%E8%A7%86%E8%A7%89-%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B%E8%A1%A5%E4%B9%A0%E8%B4%B4%E4%B9%8Byolo-you-only-look-once/

http://www.360doc.com/content/16/1230/14/25664332_618882791.shtml

http://www.360doc.com/userhome.aspx?userid=25664332&cid=70