VGG(Visual Geometry Group) |
是一个视觉几何组在2014年提出的深度卷积神经网络架构,VGG网络被广泛应用于图像分类、目标检测、语义分割等计算机视觉任务中,并且其网络结构的简单性和易实现性使得VGG成为了深度学习领域的经典模型之一; |
R-CNN |
全称是Region-CNN,是第一个成功将深度学习应用到目标检测上的算法。R-CNN基于卷积神经网络(CNN),线性回归,和支持向量机(SVM)等算法,实现目标检测技术 |
Faster R-CNN 结构 |
一种用于对象检测的深度神经网络架构。它是一个多任务学习的网络,在单个神经网络中同时学习目标检测和特征提取;分为四个模块:1. Conv layers,特征提取网络:用于从输入图像中提取特征,可以是预先训练的卷积神经网络(如VGG,ResNet等)或自定义的神经网络 ; 2. Region proposal Network(RPN)区域候选网络:RPN是一种生成提议的网络,它接收特征图并在其中生成对象的矩形提议; 3. ROI pooling,兴趣域池化:这一层以RPN网络输出的兴趣区域和Conv layers输出的feature map为输入,将两者进行综合后得到固定大小的区域特征图(proposal feature map)并输出到后面的全连接网络中进行分类; 4. Classification and Regression,分类和回归:输入为 |