head头的设计:rfcn light-head rfcn

时间:2022-08-30 17:11:15

faster缺点:1.不是全卷积,roi出来后是两个fc层,这样会丧失平移变性。

       2.每个roi都要单独经过两个fc层,也就是分别进行分类和回归,耗时

也有种说法是roi-pooling后导致平移变性丧失,这个地方还要深入思考

resnet在以faster结构为检测框架的时候,是stage4和之前作特征提取层backbone,roi-pooling后用stage5替代了两层fc,这样能增加平移变性,精度增加,但是时间上还是耗时,因为每个roi都要单独经过stage5的卷积然后分类、回归

roi-wise,个人感觉应该就和element-wise意思差不多,也就是每个roi单独的

rfcn提到:By analogy, it appears natural to use all convolutional layers to construct the shared, convolutional subnetwork in the object detection architecture, leaving the RoI-wise subnetwork no hidden layer. However, as empirically investigated in this work, this naïve solution turns out to have considerably inferior detection accuracy that does not match the network’s superior classification accuracy. To remedy this issue, in the ResNet paper [9] the RoI pooling layer of the Faster R-CNN detector [18] is unnaturally inserted between two sets of convolutional layers — this creates a deeper RoI-wise subnetwork that improves accuracy, at the cost of lower speed due to the unshared per-RoI computation.

直接用全卷积还不行,因为高的分类准确率和低的检测准确率不match

rfcn相当于既增加检测准确率(或者说平移变性),又缩短耗时。rfcn是全卷积的,并且每个roi不用单独进行fc或者卷积计算,而是直接从共享的sensetive score map上获得相关信息

light-head rfcn:

two stage网络结构包括两部分:ROI warping和 R-CNN subnet,ROI warping成为body,R-CNN subnet称为head

rfcn的sensetive score map的channel数是class*k*k,如果81类就是3969个channel。light-head rfcn将class*k*k降到n*k*k,n是任一值(论文中取10,也就是channel数变成7*7*10),改变之后导致无法像rfcn那样预测不同的class了(rfcn通过psroi-pooling后vote),个人觉得psroi-pooling出来是一个7*7*10的feature map,7*7是width和height,10这个channel和类别数无关了。所以psroi-pooling出来的cube接了一个fc,生成1*2048的vector,然后再通过两个fc分别生成cls(1*class)和bouding box regression(4*class)的vector进行预测,这个和faster是一样的。

代码部分:https://github.com/zengarden/light_head_rcnn/blob/master/experiments/li*g/light_head_rcnn.ori_res101.coco/network_desp.py

head头的设计:rfcn light-head rfcn

light-head rcnn:http://www.sohu.com/a/212814713_610300

为什么score sensetive map可以work???

https://zhuanlan.zhihu.com/p/30867916

https://www.jianshu.com/p/db1b74770e52

head头的设计:rfcn light-head rfcn的更多相关文章

  1. c++ 私有函数 头文件设计

    clock.h #ifndef CLOCK_H_INCLUDED #define CLOCK_H_INCLUDED class Clock {public: static void HandleExd ...

  2. R-FCN:

    和Faster R-CNN相比,R-FCN具有更深的共享卷积网络层,这样可以获得更加抽象的特征 抽象特征的捕获能否通过“sketch/conceptual...” - guided 来进行?想法还是说 ...

  3. R-FCN论文翻译

    R-FCN论文翻译 R-FCN: Object Detection viaRegion-based Fully Convolutional Networks 2018.2.6   论文地址:R-FCN ...

  4. object detection[rfcn]

    0 - 背景 从rcnn,spp,fast rcnn, faster rcnn,yolo,ssd,这里又有个新模型叫rfcn,即Region-based Fully Convolutional Net ...

  5. R-FCN论文理解

    一.R-FCN初探 1. R-FCN贡献 提出Position-sensitive score maps来解决目标检测的位置敏感性问题: 区域为基础的,全卷积网络的二阶段目标检测框架: 比Faster ...

  6. Faster R-CNN改进篇(二): RFCN ● RON

    @改进1:RFCN 论文:R-FCN: Object Detection via Region-based Fully Convolutional Networks    [点击下载] MXNet代码 ...

  7. 目标检测网络之 R-FCN

    R-FCN 原理 R-FCN作者指出在图片分类网络中具有平移不变性(translation invariance),而目标在图片中的位置也并不影响分类结果;但是检测网络对目标的位置比较敏感.因此Fas ...

  8. Light Pre-Pass 渲染器----为多光源设计一个渲染器

    http://blog.csdn.net/xoyojank/article/details/4460953 作者: Wolfgang Engel, 原文: http://www.wolfgang-en ...

  9. rfcn结构

    这是rfcn模型的rpn网络部分: 这是rfcn模型的rfcn网络部分: 可以看到rpn网络使用的最后一层特征提取层是resnet的res4f,rfcn网络使用的最后一层特征提取层是resnet的re ...

随机推荐

  1. 纯html页面之间传参

    //页面引入//传参方法,可解析url参数 (function($){ $.getUrlParam = function(name) { var reg = new RegExp("(^|& ...

  2. POJ 1466 Girls and Boys

    Girls and Boys Time Limit: 1 Sec  Memory Limit: 256 MB 题目连接 http://poj.org/problem?id=1466 Descripti ...

  3. Inside Flask - Flask 简介

    Inside Flask - Flask 简介 前言 Flask 的设计目标是实现一个 wsgi 的微框架,其核心代码保持简单和可扩展性,很容易学习.对于有一定经验初学者而言,跟着例子和一些书的代码来 ...

  4. SQL语句的Select部分只写必要的列

    如果Select部分包含不需要的列,这会强制DB2必须进入数据页来得到所请求的特定列,这就要求更多的I/O操作.另外,如果再对这个不需要的列进行排序,就需要创建和传递一个更大的排序文件,相应地会使排序 ...

  5. Nexus搭建Maven服务器

    参考:http://blog.csdn.net/ichsonx/article/details/14642897 1. 为什么使用Nexus 如果没有私服,我们所需的所有构件都需要通过maven的* ...

  6. 说说oracle的 sysdate、trunc函数

    SQL> select trunc(sysdate)+1/24+3 from dual; TRUNC(SYSDATE)+1/24-------------------2015-08-14 01: ...

  7. 极限挑战—C#100万条数据导入SQL SERVER数据库仅用4秒 (附源码)

    原文:极限挑战-C#100万条数据导入SQL SERVER数据库仅用4秒 (附源码) 实际工作中有时候需要把大量数据导入数据库,然后用于各种程序计算,本实验将使用5中方法完成这个过程,并详细记录各种方 ...

  8. RHEL 5.7 使用rpm安装XtraBackup问题总结

    在Red Hat Enterprise Linux Server release 5.7 (Tikanga)上使用RPM方式安装Percona Xtrabackup 2.4.6时遇到了一些问题,特意总 ...

  9. Internet传输协议-TCP

    http://phei.eefocus.com/book/08-07/473781276058574.html http://www.eefocus.com/communication/210643 ...

  10. CI框架 -- 核心文件 之 config.php

    Config:该文件包含CI_Config类,这个类包含启用配置文件来管理的方法 /** * 加载配置文件 * * @param string $file 配置文件名 * @param bool $u ...