2021计算机视觉-包揽所有前沿论文源码 -上半年

时间:2024-11-18 11:26:06

大家是否遇到过这种情况,就是在工作或者学习的时候,想去找一些方向的网络,但是呢,尴尬的是,老旧的网络里不想要,前沿的网络又不知道有哪些。为了解决大家的这个困扰,本人决定收集2021年上半年大部分前沿的网络相关链接,之后我会( 文末附带 \color{blue}{文末附带} 文末附带 公众号 − \color{blue}{公众号 -} 公众号 海量资源。 \color{blue}{ 海量资源}。 海量资源):

每周一更新一次(下面是我多年年收集的链接地址) \color{red}{每周一更新一次(下面是我多年年收集的链接地址) } 每周一更新一次(下面是我多年年收集的链接地址)
计算机视觉-包揽所有前沿论文源码

有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励!

视觉工作项目-为后来的你,提供一份帮助!
上面这个链接是我所有工作项目的详细解。 \color{red}{上面这个链接是我所有工作项目的详细解。} 上面这个链接是我所有工作项目的详细解。

 

文章分类

(01)AAAI 2021 | 腾讯优图11篇论文入选,涵盖动作识别、人群密度估计、人脸安全等领域
(02)重磅!网易伏羲9篇论文入选AI顶会AAAI 2021
(03)CVPR2020 最全整理:论文汇总 / 代码 / 项目 / 论文解读(更新中)【计算机视觉】
(04)CVPR、ECCV 2020 两大会议论文分类索引
(05)人体姿态估计、识别与生成最新技术一览
(06)一文概览 CVPR2021 最新18篇 Oral 论文
(07)WACV 2021 论文大盘点-GAN 篇与行人监控篇
(08)近期必看的视觉综述,含 GAN、Transformer、人脸超分辨、遥感等
(09)CVPR2021 最全整理:论文汇总 / 代码 / 项目 / 论文解读(更新中)【计算机视觉】
(10)重磅!悉尼科大ReLER实验室13篇论文入选CVPR 2021
(21)WACV 2021 论文大盘点 目标检测与图像分割篇(持续更新)
(22)WACV 2021 论文大盘点-GAN 篇与行人监控篇
(23)近期必看的视觉综述,含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等
(24)WACV 2021 论文大盘点-人体动作检测与识别 & 图像与视频检索篇
(25)AAAI 2021 | 微软亚洲研究院优秀论文汇总!
(26)一文概览 CVPR2021 最新18篇 Oral 论文
(27)CVPR2021 最全整理:论文汇总 / 代码 / 项目 / 论文解读(更新中)【计算机视觉】
(28)CVPR2021最新接收论文合集!22个方向100+篇论文汇总|持续更新
(29)推荐几篇近期必看的视觉综述,含GAN、Transformer、人脸超分辨、遥感等
(30)推荐几篇近期必看的视觉综述,含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等
(31)强调应用的WACV 2021,5篇最佳论文都在这里了
(32)CVPR 2021 论文分类汇总!持续更新中!
(33)/52CV/CVPR-2021-Papers

(34)CVPR2021中的目标检测和语义分割论文汇总
(35)一文概览 CVPR2021 最新18篇 Oral 论文
(36)CVPR 2021 | 腾讯AI Lab入选论文解读
(37)顶会论文分类汇总,包含WACV21/CVPR19、20/ECCV20(附下载)
(38)2021 最新CV综述分类汇总(持续更新)
(39)CVPR 2021 论文/代码分类汇总!持续更新中!
(40)CVPR 2021 速览 | 旷视研究院22篇入选学术成果盘点
(41)一文概览 CVPR2021 最新18篇 Oral 论文
(42)CVPR 2021放榜,腾讯优图20篇论文都在这里了!
(43)CVPR 二十年,影响力最大的10篇论文!
(44)CVPR 2021公布最佳论文候选!华人占据半壁*,何恺明、沈春华等人上榜
(45)添加链接描述CVPR 2021大奖出炉!何恺明获最佳论文提名,华人四篇“最佳”!第一届Thomas S. Huang 纪念奖颁发
(46)CVPR 二十年,影响力最大的10篇论文!
(47)刚刚,CVPR 2021 最佳论文、最佳学生论文等奖项出炉了!(附论文下载地址)
(48)CVPR 2021奖项出炉:最佳论文花落马普所,何恺明获提名,首届黄煦涛纪念奖颁布
(49)本周开源论文推荐:含人脸识别、实例分割、跟踪、SR等
(50)CVPR 2021 论文开放下载了!
(51)[CVPR 2021 Best Paper Candidate] 32篇最佳论文候选已公布,猜一猜哪篇最终荣获 CVPR 2021 最佳论文?
(52)【6月2日】十篇(将)开源论文代码分享
(53)5月26日】七篇(将)开源论文代码分享
(56)2021 745 篇已出论文最全分类汇总!
(57)推荐几篇新出的 CVPR 2021开源论文,含图像分割、域适应、图像检索、视线估计等

 

人脸技术

(01)CVPR2020最佳新框架|大规模人脸表情识别(附源代码)
(02)大盘点|轻量级人脸检测算法实现,快到没朋友的都在这里了~
(03)10种轻量级人脸检测算法大PK | 代码开源
(04)人脸识别剩下难题:从遮挡,年龄,姿态,妆造到亲属关系,人脸攻击
(05)人脸识别中的活体检测算法综述
(06)TinaFace:人脸检测新纪录!
(07)准确率超99.5%!滴滴开源防疫口罩识别技术,及视觉比赛进展
(08)京东AI:戴口罩人脸识别pytorch开源库
(09)无需人脸检测和关键点定位,Facebook 等提出实时 3D 人脸姿态估计新方法
(11)大盘点 | 2020年「13篇」人脸算法最佳综述
(12)WACV 2021 论文大盘点-图像质量 & 姿态估计 & 3D 篇
(13)WACV 2021 论文大盘点-视频理解篇 & 图像质量篇
(14)OpenVINO + OpenCV 实现点头与摇头识别验证
(15)无需人脸检测和关键点定位,Facebook 等提出实时 3D 人脸姿态估计新方法
(16)如何入门多视角人脸正面化生成?不得不看的超详细最新综述!
(07)WACV 2021 论文大盘点-人脸技术篇
(08)重要!分享几个业界新出人脸识别数据集
(09)Facebook等新提出的视听语音分离的方法VisualVoice,利用跨模态一致性
VisualVoice: Audio-Visual Speech Separation with Cross-Modal Consistency
单位 |德克萨斯大学奥斯汀分校,Facebook
论文 |/abs/2101.03149
代码 |/facebookresearch/VisualVoice
主页 |/projects/VisualVoice/
(10)人脸超分辨率,基于迭代合作的方法
(11)不得不赞!京东开源FaceX-Zoo,一站式人脸识别研究平台
(12)跳过人脸检测和关键点定位,Facebook等提出实时3D人脸姿态估计新方法
(13)无需人脸检测和关键点定位,Facebook等提出实时3D人脸姿态估计新方法
(14)CVPR 2021 | 中科大联合快手,提出人脸伪造检测新方法
(15)Face Transformer for Recognition用于人脸识别
(16)中国队拿下口罩人脸识别世界第一!
(17)开源了!仅有85K个参数的人脸检测算法
(18)遮挡人脸问题 | 详细解读 Attention-Based 方法解决遮挡人脸识别问题(附论文下载)
(19)CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实!
(20)OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测
(21)腾讯优图TFace正式开源,更可信的人脸识别!
(22)CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实!
(23)单目3D人脸重建,皱纹可以随着表情而产生自然变化,更加逼真。
(24)D人脸建模 Snap 等提出首个 one-shot 3D 人脸风格迁移化的框架,只需要一张任意风格的图像,它可以生成具有夸张的几何形状和纹理风格化的三维人脸模型,

 

目标检测

(01)视频目标检测大盘点
(02)R-CenterNet:用CenterNet对旋转目标进行检测
(03)香港大学提出OneNet:一阶段端到端目标检测网络,无需NMS!无需二分匹配!
(04)异常检测(Anomaly Detection)综述
(05)开源软件 | 深度学习用于道路病害检测
(06)Transformer 又立功了!又快(420 fps)又好的车道线检测算法
(07)NanoDet:轻量级(1.8MB)、超快速(移动端97fps)目标检测项目
(08)用实力给自己正名,YOLOv5:道路损伤检测我最强!GRDDC’2020大赛报告
(09)YOLO之外的另一选择,手机端97FPS的Anchor-Free目标检测模型NanoDet现已开源~
(10)优秀!港大同济伯克利提出Sparse R-CNN: 目标检测新范式
(11)目标检测无痛涨点之 Generalized Focal Loss V2
(12)用CenterNet对旋转目标进行检测
(13)基于计算机视觉的裂纹检测方案
(14)香港中文大学多媒体实验室 | 开源视频目标检测&跟踪平台(附源码下载)
(15)基于密度图的航空物体检测:理论与代码实现
(16)目标检测的稀疏对抗攻击,代码已开源
(17)北亚利桑那大学等推出:航拍森林火情检测数据集 FLAME
(18)无需NMS的目标检测,OneNet
(19)NAS在检测中的应用
(20)NeurIPS 2020 | 微软亚洲研究院论文摘录之目标检测篇
(21)难以置信的目标检测小妙招:多训练几个epochs,平均一下就能获得更好的模型

(22)目标检测的稀疏对抗攻击,代码已开源
(23)C++ 实现 yolov5 的 OpenVINO 部署
(24)极市直播回放丨第75期-方浩:车道线检测新SOTA,RESA:循环特征位移聚合器(AAAI2021)
(25)一文梳理缺陷检测方法
(26)开源项目|基于YOLO-V5实现行人社交距离风险提示(附完整源码)
(27)重磅!13 篇基于 Anchor free 的目标检测方法
(28)旋转目标检测方法解读(DCL, CVPR2021)
(29)一文梳理缺陷检测方法
(30)没有NMS!阿里巴巴和阿大提出PSS:更简单有效的端到端目标检测
(14)涨点技巧!小目标检测:数据增广
(15)AAAI 2021 目标检测论文大盘点(YOLObile/R3Det/StarNet等)
(16)目标检测比赛思路、tricks集锦、资料汇总
(17)CVPR 2021 | GFLV2:目标检测良心技术,无Cost涨点!
(18)实用教程详解:用OpenCV的DNN模块部署YOLOv5目标检测
(19)干货实践 | Anchor 优化后在目标检测提升这么明显
(20)物体检测中的小物体问题
(21)大改 Yolo 框架 | 能源消耗极低的目标检测新框架(附论文下载)
(22)小目标检测:数据增强
(23)大盘点 | 2020年 2 篇异常算法最佳综述
(24)小目标检测:Feature Extraction
(25)工业图像异常检测最新研究总结(2019-2020)
(26)综述丨工业金属平面材料表面缺陷检测的研究进展
(27)详解基于深度学习的伪装目标检测
(28)基于 Caffe 格式部署 YOLOV5 模型
(29)#WACV 2021 FisheyeYOLO:用于自动驾驶的鱼眼相机上的通用物体检测。针对鱼眼图像中的物体检测,研究不同的物体表示方法中作者找到了更好的表示方法,如定向边界盒、椭圆和通用多边形。并设计了一种新型的曲线边界盒模型,该模型具有鱼眼畸变模型的最佳特性。FisheyeYOLO: Generalized Object Detection on Fisheye Cameras for Autonomous Driving单位 | 利默里克大学,Valeo论文 | /publication/346931586_FisheyeYOLO_Object_Detection_on_Fisheye_Cameras_for_Autonomous_Driving代码 | 暂未

(30)基于密度图的航空物体检测:理论与代码实现
(31)WACV 2021 论文大盘点-目标检测篇
(32)AAAI 2021中的目标检测(详细版with code)
(33)从L1 loss到EIoU loss,目标检测边框回归的损失函数一览
(34)#城市天眼# 由美国 Skylark Labs 公司开发,无人机安防监控,可在高空中(3-90米)对人群检测并分析行为,发现可疑活动。
来源:/i/status/1364086835266211843
(35)不用激光雷达,照样又快又准!3D目标检测之SMOKE
(36)理解物体检测中的Objectness

(37)目标检测一卷到底之后,终于有人为它挖了个新坑|CVPR2021 Oral
(38)CVPR2021目标检测佳作 | Weighted boxes fusion(附github源码及论文下载)
(39)基于YOLOV4深度网络的车辆压实线检测算法
(40)56.4 AP!超越YOLOv4,更快更强的CenterNet2来了!
(41)CVPR2121目标检测 | 少见的知识蒸馏用于目标检测(附论文下载)
(42)用于自动驾驶的实时车道线检测和智能告警
(43)全新FPN!CE-FPN:通道增强特征金字塔网络,助力目标检测涨点!
(44)极市项目|未拴绳遛狗识别算法需求
(45)基于YOLOV5深度网络模型的火焰检测
(46)基于YOLOV5深度网络模型的交通标志设施的模型训练
(47)基于深度学习YOLOV5网络的道路状况检测
(48)基于YOLOV5深度网络的公路病害检测
(49)使用Disentangling形式的损失函数回归2D和3D目标框
(50)CVPR 2021 | 腾讯AI Lab入选论文解读
(51)实操教程:android camera nanodet 实时物体检测的高效实现总结
(52)CVPR2021 目标检测佳作 | Weighted boxes fusion(附 GitHub 源码及论文下载)
(53)我扔掉FPN来做目标检测,效果竟然这么强!YOLOF开源:你只需要看一层特征|CVPR2021
(54)【入门教程】异常检测(Anomaly Detection)到底是什么?
(55)最强检测 | YOLO V4?都是弟弟! CenterNet2以56.4mAP超越当前所有检测模型
(56)mmdetection性能简单优化方法
(57)目标检测一卷到底之后,终于有人为它挖了个新坑|CVPR2021 Oral
(58)轻量高速检测器LFFD升级版LFD发布!用Pytorch部署,支持多类检测
(59)船舶检测 | 计算机视觉来看苏伊士运河堵船
(60)基于YOLOV4的印刷电路板PCB目标检测
(61)INT4量化用于目标检测
(62)超越YOLOv5!PP-YOLOv2:更快更好的目标检测网络
(62)Hugging Face发布PyTorch新库「Accelerate」:适用于多GPU、TPU、混合精度训练
(63)超越YOLOv5还不够!这个目标检测开源项目又上新了
(64)60.6 AP!打破COCO记录!微软提出DyHead:将注意力与目标检测Heads统一
(65)当YOLOv5遇见OpenVINO!
(66)OpenVINO™ 头部姿态评估网络应用演示
(67)实操教程|YOLOv5实现自定义对象训练与OpenVINO部署全解析
(68)缺陷检测算法汇总(传统+深度学习方式)|综述、源码
(69)一文梳理水下目标检测方法
(70)不容忽视的问题:行人检测器的泛化能力
(71)让检测告别遮挡 | NMS-Loss是如何解决目标检测中的遮挡问题的?
(72)旋转目标检测 | 基于高斯 Wasserstein 距离损失的目标检测(附源代码)
(73)干货 | 利用像机图像通过卷积神经网络实时进行水稻检测(致敬袁老)
(74)MaskedFace-Net | 新冠疫情中的口罩检测(附论文及源代码)
(75)CVPR 2021 | 谷歌提出MobileDets:轻量化目标检测网络
(76)收藏 | 使用合成数据集做目标检测
(77)运动目标检测之-ViBe算法
(78)目标检测精选系列,目前最全的总结!(附论文下载)
(79)特别小的目标检测识别(附论文下载)
(80)新目标检测框架 | 基于改进的one-shot的目标检测
(81)PPCNN:细粒度特征提取和定位用于目标检测(附论文下载)
(82)基于深度学习的车道线检测算法
(83)CVPR实时移动端检测场景竞赛:字节跳动绝对优势夺冠
(84)极市项目|物料空仓检测识别算法
(85)目标检测 | 基于统计自适应线性回归的目标尺寸预测
(86)YOLOF:速度和效果均超过YOLOv4的检测模型
(87)基于深度学习的公路病害检测方法研究
(88)OTA:目标检测中的最优传输分配
(89)目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载)
(89)基于图像处理的道路路面裂缝检测研究现状
(90)开源项目推荐 yolov5-face:

 

分类,重识别(主干网络)

(01)1.8M超轻量目标检测模型NanoDet,比YOLO跑得快,上线两天Star量超200
(02)中山大学提出新型行人重识别方法和史上最大评测基准
(03)ECCV 2020 论文大盘点-遥感与航空影像处理识别篇
(04)中山大学提出新型行人重识别方法和史上最大评测基准
(05)视频人员重识别:关系引导空间注意力 + 时间特征提取模型
(06)武汉大学等发布ReID最新综述!囊括三大视觉顶会,提出新基准方法AGW|TPAMI2021
(07)中山大学提出新型行人重识别方法和史上最大评测基准
(08)全面升级!FastReID V1.0正式开源:Beyond reID
(09)最强ResNet变体!归一化再见!DeepMind提出NFNet,代码已开源!
(10)深度学习行人重识别综述与展望,TPAMI 2021 最新文章
(11)摄像机域内监督行人重识别问题
(12)WACV 2021 论文大盘点-图像分类篇
(13)WACV 2021 论文大盘点-图像与视频检索篇
(14)CVPR 2021 | 目标引导的人类注意力估计提升零样本学习
(15)大道至简!深度解读CVPR2021论文RepVGG!
(16)提出端到端的原型跨域自监督学习(PCS)框架,用于 Few-shot 无监督域适应(FUDA)。
(17)ResNet强势升级,仅改进训练和扩展策略便与EfficientNets一争高下

(19)CVPR2021|ACNet再进化,清华大学&旷视科技提出Inception类型的DBB
(20)时隔两年,EfficientNet v2来了!更快,更小,更强!
(21)89.77%准确率!谷歌提出CoAtNet:将卷积与自注意力结合
(22)CVPR 2021 Oral | 超越卷积的自注意力新模型!谷歌提出:HaloNet,又一超强视觉主干…
(23)高光谱图像的遥感图像分类研究现状以及问题
(24)谷歌提出「卷积+注意力」新模型,超越ResNet最强变体!
(25)全球首个开源图像识别系统上线了
(26)字节跳动获CVPR2021 细粒度图像竞赛双料冠军
(27)干货 | 阿里的图像搜索架构
(28)EfficientNetV2

 

语义目标分割

(01)NeurIPS 2020 Oral: 利用像素级别循环一致性来解决域适应语义分割问题
(02)性能提升30%以上!产业SOTA的实时实例分割算法SOLOv2,更快更强!
(03)CVPR 2020 论文大盘点-抠图 Matting 篇
(04)不用绿幕也能实时抠图,商汤等提出只需单张图像、单个模型的新方法MODNet
(05)性能提升30%以上,实时实例分割算法SOLOv2实现产业SOTA
(06)YolactEdge,首个边缘设备上实时实例分割法(Jetson AGX Xavier:30 FPS
(07)医学图像分割最佳方法的全面比较:U-Net和U-Net++
(06)MODNet 很容易以端到端的方式进行训练。它的速度比同期抠图方法快得多,运行速度为每秒 63 帧。

(07)该工作中,作者提出 BoxInst,可以只用实例包围框标注(而非实例掩码标注)
(08)作者将这一联合任务命名为深度感知视频全景分割,并为其提出了一个新的评估指标以及两个衍生数据集,并表示这些数据集将被公开。
(09)图像分割二十年,盘点影响力最大的10篇论文
(10)2020年「21篇」医学影像算法最佳综述
(11)重新思考语义分割范式:SETR
(12)一文读懂Image matting(图像抠图)
(13)大盘点 | 2020年5篇图像分割算法最佳综述
(14)大盘点 | 2020年「21篇」医学影像算法最佳综述
(15)【资源】全景分割相关资源大列表
(16)OpenVINO + OpenCV 实现车辆检测与道路分割
(17)超快速的端到端实例分割模型,手把手教你用opencv部署Yolact
(18)WACV 2021 论文大盘点-图像分割篇
(19)2020 CCF BDCI 地块分割Top1方案 & 语义分割trick整理
(20)首个 Text Matting(文本抠图)方法,灵活好用
(21)Transformer再突破!MedT:医学图像分割新网络
(22)CVPR 2021 | MSRA提出像素级别自监督预训练方法PixPro,大幅提升下游检测分割任务性能
(23)SG-net:一次视频实例分割的空间粒度网络
(24)Panoptic FCN:真正End-to-End的全景分割
(25)CVPR 2021 Oral | Transformer再突破!美团等提出VisTR:视频实例分割网络
(26)CVPR 2021 | 250 FPS!让实时语义分割飞起!重新思考BiSeNet
(27)顶刊TPAMI 2021!南开大学提出深度霍夫变换:语义线检测新方法
(28)Segmenter:基于纯Transformer的语义分割网络
(29)谷歌等新作:视觉Transformer的有趣特性
(30)视觉Transformer比CNN更鲁棒!IBM华人研究员新作
(31)更快更强!谷歌提出NesT:收敛更快、鲁棒更好的Transformer

(32)种实时,高分辨率的背景替换技术,可在4K分辨率下以30fps的速度运行,HD情况下以60fps的速度运行,代码已开源!
(33)港大&NVIDIA提出SegFormer:简单有效Transformer的语义分割新思路
(34)实操教程|使用图像分割来做缺陷检测的一个例子
(35)CVPR2021佳作 | One-Shot都嫌多,Zero-Shot实例样本分割
(36)训练数据不需要手工标注分割,也能实现图像分割?
(37)CVPR2021 双图层实例分割,大幅提升遮挡处理性能
(38)Google发布语义分割新数据集!顺带开发个模型屠榜,已被CVPR2021接收

 

目标追踪

(01)收藏 | 多目标跟踪(MOT)入门
(02)单目标跟踪综述
(03)简单粗暴的多目标跟踪神器 – DeepSort
(04)结合重检测的长时目标跟踪
(05)目标跟踪又添重磅开源工具箱,MMTracking来了!
(06)遥感图像+CNN,预测区域人口收入水平
(07)目标追踪综述
(08)WACV 2021 论文大盘点-目标跟踪篇

(09)不经意的“走两步”就能锁定身份信息,这就是步态识别黑科技。
推荐一篇新出的综述,全面介绍了步态识别的发展,包含技术演进、主要数据集、现在技术达到的水平,了解深度学习步态识别的必读论文。
Deep Gait Recognition: A Survey /pdf/2102.

(10)#手部跟踪# 人手是极其灵活的,存在各种复杂的自接触和遮挡,给跟踪带来了困难。Facebook现实实验室近日发明了一种极其精确的人手跟踪方法,通过在视觉模型中加入物理特性限制达成。无论是单手还是双手,均可实现高度精确的跟踪。
Constraining Dense Hand Surface Tracking with Elasticity
主页 |/publications/constraining-dense-hand-surface-tracking-with-elasticity/

(11)TraDeS :CVPR 2021多目标跟踪算法,改进了目前联合检测与跟踪的在线方法,使用跟踪线索辅助检测,在多个数据集实现了大幅精度提升,作者来自纽约州立大学。论文尚未公布,代码将开源。
Track to Detect and Segment: An Online Multi-Object Tracker
项目主页:/projects/

(12)基于尺度不变特征变换的多路监控视频拼接系统
(13)TCSVT2021:一种结合全局和局部细粒度特征的行人再识别方法
(14)基于SIFT尺度不变特征变换的图像拼接算法
(15)最新开源!TransReID:首个基于Transformer的ReID网络,各项任务全面领先!
(16)WACV2021论文解读-Scale Equivariance Improves Siamese Tracking
(17)端到端的多目标跟踪,代码将开源,Looking Beyond Two Frames: End-to-End Multi-Object Tracking Using Spatial and Temporal Transformers
(18)提出 SiamGAT,用于目标跟踪,性能领先许多当前先进跟踪器,达到 SOTA。
(19)TCSVT2021:一种结合全局和局部细粒度特征的行人再识别方法
(20)CVPR 2021 | 首个无需锚框(Anchor-Free)的行人搜索框架(附代码)
(21)基于YOLOV3与DeepSort的行人多目标跟踪
(22)从理论到实战!视频流车辆计数和目标跟踪
(23)TPAMI 2021 :基于 event stream 的步态识别,准确率高达90%
(24)极市直播回放丨第80期-张新宇:CVPR 2021-​Alpha Refine:通过精确的边界框估计提高跟踪性能
(25)目标跟踪入门篇-相关滤波

 

动作检测与识别

(01)MMAction2: 新一代视频理解工具箱
(02)WACV 2021 论文大盘点-人体动作检测与识别篇
(03)CVPR 2021 | 用于动作识别,即插即用、混合注意力机制的 ACTION 模块
(04)CVPR 2021 | 商汤提出最强时序动作提名修正网络:TCANet
(05)人体动作识别与生成:基于ST-GCN的方法
(06)刷爆HACS挑战赛时序动作检测榜单!TCANet:最强时序动作提名修正网络 CVPR 2021
(07)更快更强!视频理解模型PP-TSM重磅发布:速度比SlowFast快4.5倍
(08)视频异常行为检测算法MPN,在多个数据库上达到SOTA
(09)CVPR2021Oral #人体运动捕捉使用 4 个RGBD摄像头进行人体运动捕捉,在几何重建和纹理生成上效果都更好
(10)CVPR 2021 | 又好又快的视频异常检测,引入元学习的动态原型学习组件

 

姿态估算

(01)多人姿态识别框架——AlphaPose
(02)GitHub:人体姿态估计最全资料集锦
(03)人体姿态估计 (Human Pose Estimation) 常用方法总结
(04)CVPR2020 | 旷视研究院提出 PVN3D:基于 3D 关键点投票网络的单目 6DoF 位姿估计算法
(05)人体姿态估计、识别与生成最新技术一览
(06)深度学习人体姿态估计:2014-2020全面调研
(07)最新开源:端到端6D物体姿态跟踪,无需标注数据集!
(08)手势识别基础~手势骨架与关键点提取
(09)动物姿态估计!马、老虎、牛、鹿、狗狗的姿态都能搞定!斩获CVPR 2021 Oral
(10)OpenVINO™ 头部姿态评估网络应用演示
(11)CVPR 2021 | 微软提出"解构式关键点回归", 刷新COCO自底向上多人姿态检测记录!

 

OCR

(01)万字长文 | 图表示学习中的Encoder-Decoder框架
(02)霸榜Github:又一款OCR神器面世!
(03)新视角:用图像分类来建模文字识别也可以SOTA
(05)都2021了,别再堆砌网络了!10万奖金悬赏最强轻量化OCR模型
(06)顶刊TPAMI 2021!PAN++:精确高效的任意形状文本检测与识别
(07)最新!CVPR 2021 OCR领域论文大盘点(22篇)
(08)论文推荐|【KSII TIIS 2021】DP-LinkNet:一种用于古籍文档图像二值化的卷积网络(有源码)

 

3D,深度估算,点云,SLAM

(01)CVPR2020 | 3D 目标检测新框架:3DSSD
(02)CenterFusion:融合雷达与摄像头数据的高精度3D目标检测
(03)最佳论文!商汤提出手机端实时单目三维重建系统 | ISMAR 2020

(04)商汤提出手机端实时单目三维重建系统,实现逼真AR效果和交互
(05)基于深度学习的图像匹配技术一览
(06)极市直播|AAAI’21杰出论文许鸿斌:一个解决三维重建对数据依赖的新框架(已开源)
(07)OpenCV再升级!修改一行代码,将图像匹配效果提升14%!
(08)重磅!谷歌开源TensorFlow 3D场景理解库
(09)极市直播回放丨第76期-许鸿斌:AAAI’21杰出论文,一个解决三维重建对数据依赖的新框架(已开源)
(10)可用于大规模点云表面重建的深度学习算法
(11)可用于大规模点云表面重建的深度学习算法

(12)深度估计是机器人和自动驾驶研究的重要内容,而这往往需要特殊设备,如RGB-D相机或激光雷达,如何使用RGB相机感知深度呢?研究人员曾经做了很多的尝试。该视频是CVPR 2021论文Depth from Camera Motion and Object Detection结果,通过使用“普通手机摄像头运动+目标检测的包围框”数据,设计RNN网络实现了达到最先进精度的目标深度估计。单位 | 密歇根大学,史蒂文森理工学院论文 | /abs/2103.01468代码 | /griffbr/ODMD
(13)CVPR 2021 | TPCN 点云就是这么美妙
(14)一文了解激光点云的组织形式
(15)基于YOLO的新型RGB-D融合方法对行人进行检测和3D定位
(16)ECCV2020 | 夜间图像的无监督单目深度估计
(17)MVSNeRF: Fast Generalizable Radiance Field Reconstruction from Multi-View Stereo
(18)在 KITTI 基准数据集上实现最先进的单目3D目标检测结果,表现与基于单目视频的方法相当。
(19)真正实用的退化模型:ETH开源业内首个广义盲图像超分退化模型,性能效果绝佳
(20)ResNet也能用在3D模型上了!清华计图首创三角网格面片上的卷积神经网络:SubdivNet
(21)开源|AAAI‘21杰出论文-三维重建新探索:解决数据依赖问题,让自监督信号更可靠!
(22)综述:基于点云的自动驾驶3D目标检测和分类方法
(23)PatchmatchNet:一种高效multi-view stereo框架 (CVPR2021 Oral)
(24)CVPR2021|神经网络如何进行深度估计?
(25)DXSLAM:一种基于深度特征的鲁棒且高效的视觉SLAM系统
(26)实时高分辨率 RGB-D表面重建(CVPR2021)
(27)Complexer-YOLO:基于语义点云的实时三维目标检测与跟踪
(28)HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法
(29)基于点云的3D障碍物检测
(30)极市直播丨朱思语:基于深度学习的视觉稠密建图和定位
(31)基于3D Surfel图的单目直接法稀疏定位
(32)将合成 3D 场景表示合并到生成模型中,从而实现更可控的图像合成。
(33)传统单图像深度估计往往只能给出低分辨率结果,细节也不够丰富,视觉上总给人模糊不清的感觉,来自SFU和Adobe的研究者通过合并不同分辨率生成高分辨率的深度估计,终于可以还原清晰的细节。
(34)OmniPhotos, 目前最快的360°全景VR摄影方法。代码已开源。
(35)作者提出并集成GrooMeD-NMS–一种新颖的分组数学可区分的NMS,用于单眼3D物体检测,
(36)CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

 

GUN(图像生成,超分辨,动作迁移)

(01)CVPR 2020 论文大盘点-图像增强与图像恢复篇
(02)哈工大等提出轻量级盲超分辨模型LESRCNN,代码已开源
(03)最新!图像去噪综合比较研究
(04)无需用户输入,Adobe提出自动高质量图像合成新方法
(05)NVIDIA Research的研究人员提出了一种自适应鉴别器增强机制,该机制可显着稳定有限数据环境中的训练。
(06)照片秒变卡通风!教你用PaddleGAN快速生成你的专属卡通头像
(07)精准生成Fake人脸!Amazon全新GAN模型给你全方位无死角美颜
(08)博士后姐把“二次元老婆生成器”升级了!AniGAN:这一次可以指定画风
(09)训练 GANs 一年我学到的 10 个教训
(10)涵盖 18+ SOTA GAN 实现,这个开源工程 PyTorch 库火了
(11)6ms 的EfficientDeRain:颇具启发的简单高效去雨算法
(12)PULSE:一种基于隐式空间的图像超分辨率算法
(13)解决以往单图像超分辨率算法仅在合成数据上效果好,无法适用于真实场景的问题。无需对特定类型相机图像训练,即可泛化到不同的相机上。Exploiting Raw Images for Real-Scene Super-Resolution单位 | 卡内基梅隆大学,商汤,加州大学论文 | /pdf/2102.代码 | /s/a66iuwoswul65da/RawSR_PAMI20.zip?dl=0主页 | /view/xiangyuxu/rawsr_pami
(14)下一代更衣室!国外一位设计师做的虚拟试衣应用。基于OpenPose 进行2D关节点跟踪,使用 Houdini 特效渲染。
来源:/articles/next-gen-dressing-room-with-markerless-tracking-in-houdini/

(15)#GAN #WACV2021
SinGAN-GIF 可以生成任意长宽比的样本,进行超分辨率,改变时帧率,并可用于视频编辑应用。
SinGAN-GIF: Learning a Generative Video Model From a Single GIF
作者 | Rajat Arora, Yong Jae Lee
单位 | 加利福尼亚大学戴维斯分校
论文 |
/content/WACV2021/papers/Arora_SinGAN-GIF_Learning_a_Generative_Video_Model_From_a_Single_GIF_WACV_2021_paper.pdf
主页 | /singan-gif/

(16)WACV 2021 论文大盘点-图像质量篇

(17)Morph-UGATIT:一种支持渐进式域迁移的图像翻译方法
(18)近日由加州大学圣迭戈分校、CMU、Facebook 提出的一种极快速的视频插帧方法,比之前最精确的方法快384倍,比之前最快的8倍插值方法快23倍。该视频为使用该方法得到的慢动作影像。代码将开源。
FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation
units | 加利福尼亚大学圣迭戈分校;卡内基梅隆大学;Facebook AI
paper | /abs/2012.08512
github | coming
home | /FLAVR/

(19)浙大等学者发明的Neural Body算法,输入多角度视频可输出3D人体和新角度视图。论文 | /pdf/2012.代码 | /zju3dv/neuralbody(即将)

(20)CVPR 2021接收论文:AdCo基于对抗的对比学习

(21)第一个同时采用传感器数据和图像进行视频稳定的 DNN 解决方案。Deep Online Fused Video Stabilization单位 | 威斯康星麦迪逊大学,谷歌论文 | /abs/2102.01279代码 | 即将主页 | /dvs/

(22)浙大等学者发明的Neural Body算法,输入多角度视频可输出3D人体和新角度视图。论文 | /pdf/2012.代码 | /zju3dv/neuralbody(即将)

(23)TIP 2021论文:多曝光图像融合及超分辨的联合实现
(24)CVPR 2021 Oral|只用静态图像,就能实时渲染出丝滑3D效果
(25)智趣丨实时风格迁移,移动端运行,人脸特效又有了新玩法
(26)CVPR 2021 | 港科大:如何利用闪光图像(flash image)来去除反光?
(27)CVPR 2021 | Neighbor2Neighbor:仅需噪声图像即可训练任意降噪网络的方法
(28)多功能的图像超分辨模型:用于盲图像超分辨的非对称卷积神经网络
(29)深度图像修复的一个突破
(30)GANSpace: Discovering Interpretable GAN Controls
(31)TIP2021| 视频超分辨率中的多级特征融合网络
(32)rtFlow: Unbiased Image Style Transfer via Reversible Neural Flows提出 ArtFlow 来防止通用风格迁移过程中的 content leak(内容泄漏)。ArtFlow 由可逆的神经流和无偏的特征迁移模块组成。同时支持前向和后向推理,并采用投影-转移-还原的方案进行操作。ArtFlow 在避免 content leak(内容泄漏)的同时,实现了与最先进的风格迁移方法相当的性能。
(33)极市直播丨邓欣:TIP 2021-多曝光图像融合及超分辨的联合实现方法
(34)Weather GAN:实现晴、阴、雾、雨、雪之间的天气状况*迁移
(35)CVPR 2021 | 五官画风都能改,用无监督方法控制 GAN (附源码) -周博磊团队
(36)CVPR 2021|Neighbor2Neighbor:无需干净图像的自监督图像降噪
(37)图像反光能被一键去除了?港科大开源RFC,仅用一个操作,强反光也能完美去除|CVPR2021
(38)你好,这是微视AI还原的李焕英
(39)有限数据来训练GAN的一种思路
(40)揭秘腾讯微视人脸技术「黑科技」,基于GAN的人脸魔法特效
(41)添加链接描述
(42)CVPR2021|超分性能不降低,计算量降低50%,董超等人提出加速图像超分的ClassSR
(43)RealSR性能大幅提升!旷视+快手+电子科大联合提出“先发散再收敛”的D2CSR
(44)仅需2张图!AI便可生成完整运动过程
(45)PornHub 用独家数据集!修复了百年前的电影…
(46)新垣结衣夫妇的孩子会长啥样?我用BabyGAN预测试试…
(47)刚刚!AMD发布超分辨率新技术FSR:N卡也能用
(48)Transformer再下一城!ETH提出:视频超分辨率Transformer
(49)蔡徐坤x特xxx梦幻联动!这个神器能让图像实时模仿人的动作
(50)人人皆可二次元!这个GAN网络让小姐姐生成不同风格的动漫形象!肤色、发型皆可变
(51)这款AI神器,让父亲重返18岁!
(52)DSRL:灵活而简单的框架,提高网络精度的且不引入额外的计算量,CVPR2020
(53)实时 4K “image-to-image translation”,港理工&达摩院张磊团队提出拉普拉斯金字塔变换网络
(54)NBNet:抛开复杂的网络结构设计,旷世&快手提出子空间注意力模块用于图像降噪
(55)开源 | 性能炸裂,旷视提出适用于底层问题的Half Instance Normalization
(56)GNN 模型在生物化学和医疗健康中的典型应用
(57)超强面经:文本检测与GAN篇(含答案)
(58)CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性
(59)LeCun点赞!GAN模型130毫秒生成动漫肖像!
(60)Deepfake文字版横空出世:AI高仿你的笔迹只需1个词!
(61)【开源】对基于图像背景的字体生成、人体姿势预测、关键点检测、超分辨率等探讨
(62)/PhotorealismEnhancement/
(63)图像填充不怕区域大!MSRA等提出协同调制生成对抗网络
(54)CVPR 2021 Oral | GLEAN: 基于隐式生成库的高倍率图像超分辨率
(55)技压群雄!2021 NTIRE @CVPR 2021的三冠一亚视频超分方案:BasicVSR++

 

GNN(图神经相关)

(01)ECCV 2020 论文大盘点-图像视频修复篇
(02)详解:多模态知识图谱种类及其应用
(03)Facebook@ICLR2021:GNN中加入标签传播,训练时间直降100倍

 

Transformer

(01)Transformer 再下一城,Facebook 等提出多目标跟踪算法 TrackFormer
(02)全文翻译 | 华为、北大、悉尼大学:最新视觉Transformer综述(2017-2020年)
(03)计算机视觉中的Transformer
(04)Transformer 最新应用,3D 点云处理,实现 S3DIS 数据集场景分割mIoU首次突破 70% !

(05)用Pytorch轻松实现28个视觉Transformer,开源库 timm 了解一下!(附代码解读)
(06)一文看懂9种Transformer结构
(07)更深、更轻量级的Transformer!Facebook提出:DeLighT
(08)刷爆AI圈!基于Transformer的DALL-E代码刚刚开源了
(09)Transformer又来了!这个谷歌3D大法闻歌起舞,流畅且自然!
(10)视觉Transformer之简单总结
(11)效果远超Transformer!AAAI 2021最佳论文Informer:最强最快的序列预测神器
(12)Transformer携手Evolving Attention在CV与NLP领域全面涨点!
(13)无卷积!金字塔视觉Transformer(PVT):用于密集预测的多功能backbone
(14)CVPR 2021 | Transformer进军low-level视觉!北大华为等提出预训练模型IPT
(15)CVPR 2021 Oral | Transformer再发力!华南理工和微信提出UP-DETR:无监督预训练检测器
(16)搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(二)
(17)CNN与Transformer的强强联合!谷歌最新开源BoTNet,ImageNet达84.7%准确率
(18)ResNet被全面超越了,是Transformer干的:依图科技开源“可大可小”T2T-ViT,轻量版优于MobileNet
(19)来自Transformer的降维打击:ReID各项任务全面领先,阿里&浙大提出TransReID
(20)论文速递:金字塔Transformer,更适合稠密预测任务的Transformer骨干架构
(21)视觉 Transformer 的可视化|CVPR2021
(22)美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT
(23)刷爆AI圈!基于Transformer的DALL-E代码刚刚开源了
(24)CVPR2021 | 用Transformers无监督预训练进行目标检测
(25)CVPR2021 | 用Transformers无监督预训练进行目标检测
(26)Facebook首发时空Transformer 训练速度远超3D CNN!
(27)添加链接描述
(28)CVPR 2021 | Transformer再下一城!复旦等提出SETR:语义分割网络
(29)霸榜各大CV任务榜单,Swin Transformer横空出世!
(30)/abs/2103.14803
(31)On the Adversarial Robustness of Visual Transformers论 Visual Transformers 的对抗鲁棒性
(32)Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers
(33)CrossViT: Cross-Attention Multi-Scale Vision Transformer for Image Classification用于图像分类,代码将开源
(34)HiT: Hierarchical Transformer with Momentum Contrast for Video-Text Retrieval用于视频文本检索
(35)TransCenter: Transformers with Dense Queries for Multiple-Object Tracking用于多目标跟踪,代码将开源
(36)TFPose: Direct Human Pose Estimation with Transformers用于人体姿态估计,代码开源
(37)Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding
(38)/p/361092528
(39)/p/361059921
(40)新论文石锤Transformer:别只看注意力,没有残差和MLP,它啥都不是
(41)CNN再助力!CoaT:Co-Scale卷积-注意力图像Transformer
(42)复旦提出M2TR:首个多模态多尺度Transformer
(43)吴恩达真顶流!新增Transformer!深度学习课程更新,近60万人报名…
(44)Twins:重新思考视觉Transformer中的空间注意力机制
(45)屠榜各大CV任务!「百度顶会论文复现营」携Swin Transformer来袭!
(46)重磅开源!Twins:更高效的视觉Transformer主干网,完美适配下游检测、分割任务
(47)Transformer的中年危机
(48)Transformer再下一城!厦大等提出ISTR:端到端实例分割
(49)Transformer再下一城!Swin-Unet:首个纯Transformer的医学图像分割网络
(50)谷歌用傅里叶变换替换Transformer自注意力层!在GPU上快7倍、TPU上快2倍…
(51)DeepViT:迈向更深的视觉Transformer
(52)超越PVT!南大提出ResT:高效多尺度的视觉Transformer
(53)超越PVT!南大提出ResT:高效多尺度的视觉Transformer
(54)Transformer再下一城!DeepMind新模型自动生成CAD草图,网友:建筑设计要起飞了
(55)重新思考:在ResNet与Transformer均适用的跳跃连接
(56)最新!CVPR 2021 视觉Transformer论文大盘点(43篇)
(57)Transformer再下一城!low-level多个任务榜首被占领,中科大等联合提出:Uformer
(58)清华提出DynamicViT:动态Token稀疏化的高效视觉Transformer
(59)超越StyleGAN!TransGAN更新!用纯Transformer构建高分辨率GAN
(60)不是所有图像都值16x16个词!清华&华为提出DVT:动态视觉Transformer
(61)腾讯提出Shuffle Transformer:重新思考视觉Transformer的空间Shuffle
(62)Transformer杀疯了!竟在图神经网络的ImageNet大赛中夺冠,力压DeepMind、百度…
(63)谷歌大脑新作:教你训练自己的视觉Transfomer模型
(64)南开&阿里提出P2T:基于金字塔池化的视觉Transformer!可用于各类下游场景理解任务!
(65)谷歌新作:视觉Transformer超越ResNet!!!从头开始训练!
(66)Apple新作:没有注意力的Transformer依然是顶流!!!
(67)超越PVT!南大提出ResT:高效多尺度的视觉Transformer
(68)浙大&华为等提出VTP:首个用于视觉Transformer的剪枝方法
(69)Transformer 进行端到端的目标检测及跟踪(附源代码)
(70)如何看待无监督学习在 vision transformer 上的应用前景?
(71)你仅需要看一个序列!YOLOS:重新思考Transformer的泛化性能
(72)通用性 Transformer 基石视觉架构,带来大范围性能提升!(附项目地址)
(73)基于 detectron2 实现的 PVT 开源了;可用于密集任务 Backbone 的金字塔视觉 transformer
(74)搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(九)
(75)极市直播丨陈鑫:CVPR 2021-​TransT: 基于Transformer的高性能单目标跟踪算
(76)打破Transformer宿命,新秀VOLO开源!横扫CV多项记录,首个超越87%的模型
(77)OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测
(78)各类Transformer都得稍逊一筹,LV-ViT:探索多个用于提升ViT性能的高效Trick
(79)利用TRansformer进行端到端的目标检测及跟踪(附源代码)
(80)COTR 一种基于Transformer的图像匹配网络
(81)谷歌AI用30亿数据训练了一个20亿参数Vision Transformer模型,在ImageNet上达到新的SOTA!
(82)FcaNet:从频域角度重新思考注意力机制
(83)重磅开源!Twins:更高效的视觉Transformer主干网,完美适配下游检测、分割任务
(84)将Transformer引入CV届的Facebook 这次又有新发现:自监督学习 + Vision Transformers更配!

 

半监督 ,无监督,强化学习

(01)伪标签还能这样用?半监督力作UPS(ICLR 2021)大揭秘!
(02)深度学习中的3个秘密:集成,知识蒸馏和自蒸馏
(03)伪标签还能这样用?半监督力作UPS(ICLR 2021)大揭秘!
(04)从 SimCLR 到 BarLow Twins ,一文了解自监督学习不断打脸的认知发展史
(05)从4篇顶会论文看Self-training最新研究进展
(06)大盘点 | 何恺明团队在自监督领域的工作:MoCo三部曲
(07)CVPR 2021 Oral | 妙啊!不怕遮挡的图像线段匹配 SOLD2,还能联合自监督线段检测
(08)CVPR 2021 | 何恺明等人新作!深入探究无监督时空表征学习
(09)超越SEED!腾讯优图提出DisCo:拯救小模型在自监督学习中的效果
(10)CVPR 2021 | 突破性研究!将自监督学习应用到自动驾驶上
(11)LeCun联手华人博士后提出自监督学习新作!却遭Reddit网友质疑:第一张图就错了…
(12)CVPR 2021 | 北大&MSRA提出CPS:基于交叉伪监督的半监督语义分割
(13)深度了解自监督学习,就看这篇解读 !Hinton团队力作:SimCLR系列

 

模型优化,压缩,加速,NAS(网络搜索),注意力机制

(01)超越MobileNetv3!Facebook提出FP-NAS:搜索速度快,精度更高添加链接描述
(02)如何简单有效地实现迁移学习?ECCV 2020 论文介绍
(03)超越 EfficientNet与MobileNetV3,NeurIPS 2020 微软NAS方向最新研究
(04)模型压缩新突破,刷新滤波器剪枝的SOTA效果,优图NeurIPS 2020论文
(05)从频域角度重新思考注意力机制——FcaNet
(06)即插即用!视频超分中的涨点神器:iSeeBetter
(07)可变形卷积的深度思考
(08)真正的即插即用!盘点11种CNN网络设计中精巧通用的“小”插件
(10)深度学习模型压缩与加速综述
(11)量化新方:模型压缩 6 倍,无需重训练
(12)用20篇论文走完知识蒸馏在 2014-2020 年的技术进展
(13)基于TensorRT量化部署YOLOV5s 4.0模型
(14)推理实践落地 | 最详细的 Pytorch 底层算子扩展总结(文末附源码)
(15)教程:基于TensorRT完成NanoDet模型部署
(16)基于深度学习的图像与视频压缩
(17)深度学习精度提升 3 个小妙招:模型集成、知识蒸馏、自蒸馏
(18)CVPR2021深度框架训练 | 不是所有数据增强都可以提升最终精度
(19)CVPR 2021 | KeepAugment:一种简单的信息保存数据扩增方法, 助力分类/分割/检测涨点!
(20)CVPR Oral:我给大家表演一个无中生有|北航商汤耶鲁
(21)CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式
(22)动态滤波器卷积新高度!DDF:同时解决内容不可知与计算量两大缺陷|CVPR 2021
(23)Attention九层塔:注意力机制的九重理解
(24)CNN可视化又添新作!南大提出Group-CAM:高效的显著图生成方法
(25)超越自注意力!清华提出EA和EAMLP:使用两个线性层的新注意力机制
(26)即插即用!浙大&港中文提出CompConv卷积:让模型不丢精度还可以提速
(27)深度学习中的 Attention 机制总结与代码实现(2017-2021年)
(28)基于深度学习的图像增强综述
(29)完全解析 RNN, Seq2Seq, Attention 注意力机制
(30)综述 | 注意力机制
(31)CVPR 2021 | 超越卷积,自注意力模型HaloNet
(32)CVPR 2021 | 基于随机标签的神经架构搜索
(33)这可能是最强的AI算法可视化神器!

 

数据集,比赛,标注工具,实用工具

(01)CVPR 2020 算法竞赛大盘点
(02)不规则四边形坐标的标注工具(可用于车牌 / OCR / 人脸关键点)
(03)从3D人脸到自动驾驶,CVPR2020十个*开源数据集
(04)80GB医学影像数据集发布!OCTA-500公开下载
(05)火爆GitHub!3.2k Star的可视化神器开源!
(06)近距离看CNN训练!360度可视化,网友:美得不真实
(07)Tianchi 完整开源数据集!
(08)RTX 3090的深度学习环境配置指南:Pytorch、TensorFlow、Keras
(09)擦除:提升 CNN 特征可视化的 3 种重要手段
(10)50万奖金,10亿像素,这个目标检测与跟踪可不简单
(11)超2000万图片,全球最大人眼图像数据集开源了
(12)#大场景目标检测比赛# PANDA 行人、车辆多目标检测数据已开放下载,今天初赛正式开赛啦!
总计7G的数据集和相关标注,PANDA-Image由 555 张静态 十亿像素图片组成,总共包含21个不同的场景,其中Training集包括390张图片。
报名链接:/s/be6691073b92dc4f2c2f230db97af7f5
技术解读:/s/AYW7_yJjKv3dmkYJEJDJNg

(13)终于来了!我们发布了 PAKDD 2021 智能运维大赛 baseline
(14)RankDataset:超大规模数据集加载利器
(15)史上最全RGB-D数据集在这里!附详细对比下载文档!
(16)10万奖励+10万数据集!垃圾分类/表情识别等赛事全面启动!2021高通人工智能应用创新大赛来了
(17)ImageNet验证集6%的标签都是错的,MIT:十大常用数据集没那么靠谱
(18)PANDA行人和车辆多目标检测方案及baseline代码
(19)10万+数据集,表情识别/农作物病虫害识别/垃圾分类识别/手绘图像识别四大赛题等你挑战
(20)CVPR 2021 | Short-video Face Parsing Challenge 开赛,数据集已开放!
(21)54万奖金!目标检测新赛事!百度发起"智能交通检测"大赛
(22)CVPR 2021商品识别竞赛来了!阿里达摩院主办
(23)31万奖金!目标检测新赛事!第六届信也科技杯智能零售算法大赛来了
(24)ICCV 2021 | 规模最大的戴口罩人脸识别比赛启动!
(25)ICCV 2021 | 首个大规模视频语义分割比赛启动!
(26)10万奖金池!OpenMMLab算法生态大赛正式启动!
(27)动作检测/定位/解析三大赛道!ICCV 2021 DeeperAction挑战赛来了

(28)神仙打架丨NTIRE2021视频超分挑战双赛道方案
(29)3D人体目标检测与行为分析竞赛开赛,奖池7万+,数据集达16671张!
 

杂项

(01)MultiPoseNet:人体检测、姿态估计、语义分割一 “网” 打尽
(02)10 个开源 Python OpenCV 小项目,YouTube热门
(03)图像算法可以稳定处理视频了!港科大开源通用算法,解决视频处理时域不稳定问题|NeurIPS 2020
(04)性能SOTA、适用多种类型物体,国防科技大学单张RGB-D图像预测物体对称性
(05)遥感图像+CNN,预测区域人口收入水平
(06)清华&旷视提出RepVGG:让你的CNN一卷到底!
(07)RepVGG:极简架构,SOTA性能,让VGG式模型再次伟大!
(08)ICLR 2021 | SEED:自监督蒸馏学习,显著提升小模型性能!
(09)麻省理工新框架 | MIT 开源高性能自动微分框架,速度提升 4.5 倍(附框架源码)
(10)多模态深度学习:用深度学习的方式融合各种信息
(11)AdvProp:两组Batch Normalization助你在CNN对抗训练中高效涨点
(12)顶刊TPAMI 2021 | 换个损失函数就能实现数据扩增?
(13)旷视提出MomentumBN:缓解自监督学习的大batch要求,涨点明显!
(14)涨点神器!南京大学提出IC Networks:对CNN的基础单元重新建模
(15)涨点神器!重新标记ImageNet,让CNN涨点明显!代码已开源
(16)DeepMind重新设计高性能ResNet!无需激活归一化层
(17)泛化神器!李沐等人提出两种正则化技术:在CV和NLP均有大幅度提升
(18)CVPR 2021 | RepVGG:极简架构,SOTA性能,让VGG式模型再次伟大!
(19)CVPR 2021 | 涨点神器!IC-Conv:使用高效空洞搜索的Inception卷积,全方位提升!
(12)CVPR 2021 | 即插即用! CA:新注意力机制,助力分类/检测/分割涨点!
(13)ICLR2021 Oral|9行代码提高少样本学习泛化能力,代码已开源
(24)综述:轻量级CNN架构设计
(25)将位置信息嵌入通道注意力!NUS提出新机制,显著提升卷积特征表达|CVPR2021
(26)添加链接描述CVPR2021 佳作 | 重新标记 ImageNet:从全局标签到局部标签(附 GitHub 代码及论文)
(27)重新标注 ImageNet:多标签,全面提升模型性能
(28)刚刚!频域通道注意力网络FcaNet开源了!
(29)我卷我自己——cvpr2021:Involution
(30)白给的性能不要?cvpr2021-Diverse branch block
(31)极市沙龙回顾|CVPR2021-李铎:通过反转卷积的内在性质进行视觉识别
(32)DO-Conv无痛涨点:使用over-parameterized卷积层提高CNN性能
(33)动态卷积超进化!通道融合替换注意力,减少75%参数量且性能显著提升 ICLR 2021
(34)CVPR’21 | Involution:超越卷积和自注意力的神经网络新算子
(35)【新Attention】最强的Attention函数诞生啦,带给你意想不到的巨大提升!
(36)ICML 2021 (Long Oral) | 深入研究不平衡回归问题
(37)谷歌大脑新工作:把注意力放在MLP上!
(38)ICML 2021 | 稀疏训练新方法:In-Time Over-Parameterization
(40)清华提出RepMLP:FC“内卷”,卷出性能!
(41)图灵奖得主Bengio又出新论文:用强化学习提升模型泛化性!网友崩溃:idea撞车了…
(42)一文看尽深度学习中的20种卷积(附源码整理和论文解读)
(43)干货|深度学习中的重参数技巧
(44)登上更高峰!颜水成、程明明团队开源ViP,引入三维信息编码机制,无需卷积与注意力
(45)最新视频防抖论文精选 + 开源代码汇总
(46)CVPR 2021 | 任何人都能“不讲武德”,姿态可控的语音驱动说话人脸
(47)CV圈杀疯了!继谷歌后,清华、牛津等学者又发表三篇MLP相关论文,LeCun也在发声
(48)领域泛化最新综述
(49)实践教程|利用CNN来检测伪造图像
(50)介绍一种新的激活函数族ACON
(51)CVPR 2021 图像压缩最新进展
(52)Google发布语义分割新数据集!顺带开发个模型屠榜,已被CVPR2021接收
(53)CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

 

文章阅读

(01)LS-Net:单双目视觉的非线性最小二乘学习算法
(02)GNN、RL强势崛起,CNN初现疲态?这是ICLR 2021最全论文主题分析
(03)何恺明团队最新力作SimSiam:消除表征学习“崩溃解”,探寻对比表达学习成功之根源
(04)简洁的架构还能高效和准确?清华&华为提出新型残差循环超分模型:RRN!
(05)华为北大等联手打造的Transformer竟在CV领域超过了CNN:多项底层视觉任务达到SOTA
(06)腾讯微视模型 | 单模型史上最佳成绩,(BLENDer)登顶权威榜单VCR
(07)令人“细思极恐”的Faster-R-CNN
(08)ACCV 2020 最受关注的 Top10 代码开源论文!

(09)详解:多模态知识图谱种类及其应用
(10)噪声样本优秀论文综述(2017-2020)
(11)当频域(DCT)遇见CNN
(11)小哥质疑谷歌顶会CV论文有错!并且拿出了复现代码来证明
(12)深入研究模型压缩经典Ghostnet:如何用少量计算生成大量特征图?
(13)AAAI21最佳论文Informer:效果远超Transformer的长序列预测神器!
(14)深度学习的目标检测算法是如何解决尺度问题的?
(15)图解RepVGG
(16)详解:多模态知识图谱种类及其应用
(17)激活还是不激活?CVPR2021-Activate Or Not: Learning Customized Activation
(18)当CV遇上联邦学习!FedVision:首个轻量级、可扩展的视觉联邦开源框架
(19)深度学习前人精度很高了,该怎么创新?
(20)谷歌AI研究院:被低估的数据!被高估的模型…
(21)新坑来了!谷歌提出MLP-Mixer:一种纯MLP构成的视觉架构
(22)我为中国第一张火星照片做鱼眼矫正
(23)同行评审就是个笑话!Nature爆料:计算机生成的垃圾文章竟还能被接受,64%来自中国
(24)视觉架构大一统!港中文提出:Container,对CNN、Transformer和MLP-Mixer进行了大一统
(25)真·自行车!华为天才少年刚刚「发布」了一款无人驾驶自行车,网友:这TM不比特斯拉燃?
(26)论文无法复现!真公开处刑!PapersWithCode上线「论文复现报告」
(27)2021年,深度学习还有哪些未饱和、有潜力且处于上升期的研究方向?
(28)波士顿动力机器狗打工这一年
(29)无人驾驶车辆跟踪技术研究介绍

在这里插入图片描述