deep learning on object detection

时间:2021-09-01 21:30:32

回归工作一周,忙的头晕,看了两三篇文章,主要在写各种文档和走各种办事流程了……

这次来写写object detection最近看的三篇文章吧。都不是最近的文章,但是是今年的文章,我也想借此让自己赶快熟悉起来之前的工作。

首先是google的工作,Speed/accuracy trade-offs for modern convolutional object detectors,下载地址:https://arxiv.org/abs/1611.10012。 11月份的工作,文章工作就如标题一样,我觉得还是有参考价值的。是基于tenseflow的,我没有基于这个平台做检测过。

还有一篇是SSD,Single Shot MultiBox Detector,这篇文章已经出第四版了,发表在ECCV16上的oral,下载地址:http://arxiv.org/abs/1512.02325。11月份出的最新版,看了一下,最新版的实验结果仍然是基于VGG16,根据之前我和作者邮件联系的结果,以及我自己的测试结果,估计在别的模型上结果并没有得到提升吧,这点和上面的工作一致,这个也说明,SSD的调优感觉不容易,按照道理来说,inception v4,v3和resnet101,resnet152的检测结果应该比VGG16好不少的啊。看了作者公开的代码,现在已经可以处理视频数据了,作者也公开了在007上的检测结果,效果看着很酷奥。

第三篇就是rfcn,是微软的工作。R-FCN: Object Detection via Region-based Fully Convolutional Networks,下载地址:https://arxiv.org/abs/1605.06409。他们这两年的工作做得很不错,需要系统学习一下再来说。