2021计算机视觉-包揽所有前沿论文源码 -上半年

大家是否遇到过这种情况，就是在工作或者学习的时候，想去找一些方向的网络，但是呢，尴尬的是，老旧的网络里不想要，前沿的网络又不知道有哪些。为了解决大家的这个困扰，本人决定收集2021年上半年大部分前沿的网络相关链接，之后我会( $\color{blue}{文末附带}$ $\color{blue}{公众号 -}$ $\color{blue}{ 海量资源}。$ )：

$\color{red}{每周一更新一次（下面是我多年年收集的链接地址） }$
计算机视觉-包揽所有前沿论文源码

有兴趣的朋友可以加微信：17575010159 相互讨论技术。若是帮助到了你什么，一定要记得点赞！因为这是对我最大的鼓励!

视觉工作项目-为后来的你，提供一份帮助！
$\color{red}{上面这个链接是我所有工作项目的详细解。}$

文章分类

（01）AAAI 2021 | 腾讯优图11篇论文入选，涵盖动作识别、人群密度估计、人脸安全等领域
（02）重磅！网易伏羲9篇论文入选AI顶会AAAI 2021
（03）CVPR2020 最全整理：论文汇总 / 代码 / 项目 / 论文解读（更新中）【计算机视觉】
（04）CVPR、ECCV 2020 两大会议论文分类索引
（05）人体姿态估计、识别与生成最新技术一览
（06）一文概览 CVPR2021 最新18篇 Oral 论文
（07）WACV 2021 论文大盘点-GAN 篇与行人监控篇
（08）近期必看的视觉综述，含 GAN、Transformer、人脸超分辨、遥感等
（09）CVPR2021 最全整理：论文汇总 / 代码 / 项目 / 论文解读（更新中）【计算机视觉】
（10）重磅！悉尼科大ReLER实验室13篇论文入选CVPR 2021
（21）WACV 2021 论文大盘点目标检测与图像分割篇（持续更新）
（22）WACV 2021 论文大盘点-GAN 篇与行人监控篇
（23）近期必看的视觉综述，含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等
（24）WACV 2021 论文大盘点-人体动作检测与识别 & 图像与视频检索篇
（25）AAAI 2021 | 微软亚洲研究院优秀论文汇总！
（26）一文概览 CVPR2021 最新18篇 Oral 论文
（27）CVPR2021 最全整理：论文汇总 / 代码 / 项目 / 论文解读（更新中）【计算机视觉】
（28）CVPR2021最新接收论文合集！22个方向100+篇论文汇总｜持续更新
（29）推荐几篇近期必看的视觉综述，含GAN、Transformer、人脸超分辨、遥感等
（30）推荐几篇近期必看的视觉综述，含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等
（31）强调应用的WACV 2021，5篇最佳论文都在这里了
（32）CVPR 2021 论文分类汇总！持续更新中！
（33）/52CV/CVPR-2021-Papers

（34）CVPR2021中的目标检测和语义分割论文汇总
（35）一文概览 CVPR2021 最新18篇 Oral 论文
（36）CVPR 2021 | 腾讯AI Lab入选论文解读
（37）顶会论文分类汇总，包含WACV21/CVPR19、20/ECCV20（附下载）
（38）2021 最新CV综述分类汇总（持续更新）
（39）CVPR 2021 论文/代码分类汇总！持续更新中！
（40）CVPR 2021 速览 | 旷视研究院22篇入选学术成果盘点
（41）一文概览 CVPR2021 最新18篇 Oral 论文
（42）CVPR 2021放榜，腾讯优图20篇论文都在这里了！
（43）CVPR 二十年，影响力最大的10篇论文！
（44）CVPR 2021公布最佳论文候选！华人占据半壁*，何恺明、沈春华等人上榜
（45）添加链接描述CVPR 2021大奖出炉！何恺明获最佳论文提名，华人四篇“最佳”！第一届Thomas S. Huang 纪念奖颁发）
（46）CVPR 二十年，影响力最大的10篇论文！
（47）刚刚，CVPR 2021 最佳论文、最佳学生论文等奖项出炉了！（附论文下载地址）
（48）CVPR 2021奖项出炉：最佳论文花落马普所，何恺明获提名，首届黄煦涛纪念奖颁布
（49）本周开源论文推荐：含人脸识别、实例分割、跟踪、SR等
（50）CVPR 2021 论文开放下载了！
（51）[CVPR 2021 Best Paper Candidate] 32篇最佳论文候选已公布，猜一猜哪篇最终荣获 CVPR 2021 最佳论文？
（52）【6月2日】十篇（将）开源论文代码分享
（53）5月26日】七篇（将）开源论文代码分享
（56）2021 745 篇已出论文最全分类汇总！
（57）推荐几篇新出的 CVPR 2021开源论文，含图像分割、域适应、图像检索、视线估计等

人脸技术

（01）CVPR2020最佳新框架｜大规模人脸表情识别（附源代码）
（02）大盘点｜轻量级人脸检测算法实现，快到没朋友的都在这里了～
（03）10种轻量级人脸检测算法大PK ｜代码开源
（04）人脸识别剩下难题：从遮挡，年龄，姿态，妆造到亲属关系，人脸攻击
（05）人脸识别中的活体检测算法综述
（06）TinaFace：人脸检测新纪录！
（07）准确率超99.5%！滴滴开源防疫口罩识别技术，及视觉比赛进展
（08）京东AI：戴口罩人脸识别pytorch开源库
（09）无需人脸检测和关键点定位，Facebook 等提出实时 3D 人脸姿态估计新方法
（11）大盘点 | 2020年「13篇」人脸算法最佳综述
（12）WACV 2021 论文大盘点-图像质量 & 姿态估计 & 3D 篇
（13）WACV 2021 论文大盘点-视频理解篇 & 图像质量篇
（14）OpenVINO + OpenCV 实现点头与摇头识别验证
（15）无需人脸检测和关键点定位，Facebook 等提出实时 3D 人脸姿态估计新方法
（16）如何入门多视角人脸正面化生成？不得不看的超详细最新综述！
（07）WACV 2021 论文大盘点-人脸技术篇
（08）重要！分享几个业界新出人脸识别数据集
（09）Facebook等新提出的视听语音分离的方法VisualVoice，利用跨模态一致性
VisualVoice: Audio-Visual Speech Separation with Cross-Modal Consistency
单位 |德克萨斯大学奥斯汀分校，Facebook
论文 |/abs/2101.03149
代码 |/facebookresearch/VisualVoice
主页 |/projects/VisualVoice/
（10）人脸超分辨率，基于迭代合作的方法
（11）不得不赞！京东开源FaceX-Zoo，一站式人脸识别研究平台
（12）跳过人脸检测和关键点定位，Facebook等提出实时3D人脸姿态估计新方法
（13）无需人脸检测和关键点定位，Facebook等提出实时3D人脸姿态估计新方法
（14）CVPR 2021 | 中科大联合快手，提出人脸伪造检测新方法
（15）Face Transformer for Recognition用于人脸识别
（16）中国队拿下口罩人脸识别世界第一！
（17）开源了！仅有85K个参数的人脸检测算法
（18）遮挡人脸问题 | 详细解读 Attention-Based 方法解决遮挡人脸识别问题（附论文下载）
（19）CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破：基于生成网络的渲染器！几何形状更精准！渲染效果更真实！
（20）OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测
（21）腾讯优图TFace正式开源，更可信的人脸识别！
（22）CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破：基于生成网络的渲染器！几何形状更精准！渲染效果更真实！
（23）单目3D人脸重建，皱纹可以随着表情而产生自然变化，更加逼真。
（24）D人脸建模 Snap 等提出首个 one-shot 3D 人脸风格迁移化的框架，只需要一张任意风格的图像，它可以生成具有夸张的几何形状和纹理风格化的三维人脸模型，

目标检测

（01）视频目标检测大盘点
（02）R-CenterNet:用CenterNet对旋转目标进行检测
（03）香港大学提出OneNet：一阶段端到端目标检测网络，无需NMS！无需二分匹配！
（04）异常检测（Anomaly Detection）综述
（05）开源软件 | 深度学习用于道路病害检测
（06）Transformer 又立功了！又快(420 fps)又好的车道线检测算法
（07）NanoDet：轻量级（1.8MB）、超快速（移动端97fps）目标检测项目
（08）用实力给自己正名，YOLOv5：道路损伤检测我最强！GRDDC’2020大赛报告
（09）YOLO之外的另一选择，手机端97FPS的Anchor-Free目标检测模型NanoDet现已开源~
（10）优秀！港大同济伯克利提出Sparse R-CNN: 目标检测新范式
（11）目标检测无痛涨点之 Generalized Focal Loss V2
（12）用CenterNet对旋转目标进行检测
（13）基于计算机视觉的裂纹检测方案
（14）香港中文大学多媒体实验室 | 开源视频目标检测&跟踪平台（附源码下载）
（15）基于密度图的航空物体检测：理论与代码实现
（16）目标检测的稀疏对抗攻击，代码已开源
（17）北亚利桑那大学等推出：航拍森林火情检测数据集 FLAME
（18）无需NMS的目标检测，OneNet
（19）NAS在检测中的应用
（20）NeurIPS 2020 | 微软亚洲研究院论文摘录之目标检测篇
（21）难以置信的目标检测小妙招：多训练几个epochs，平均一下就能获得更好的模型

（22）目标检测的稀疏对抗攻击，代码已开源
（23）C++ 实现 yolov5 的 OpenVINO 部署
（24）极市直播回放丨第75期-方浩：车道线检测新SOTA，RESA：循环特征位移聚合器（AAAI2021）
（25）一文梳理缺陷检测方法
（26）开源项目｜基于YOLO-V5实现行人社交距离风险提示(附完整源码)
（27）重磅！13 篇基于 Anchor free 的目标检测方法
（28）旋转目标检测方法解读（DCL, CVPR2021）
（29）一文梳理缺陷检测方法
（30）没有NMS！阿里巴巴和阿大提出PSS：更简单有效的端到端目标检测
（14）涨点技巧！小目标检测：数据增广
（15）AAAI 2021 目标检测论文大盘点（YOLObile/R3Det/StarNet等）
（16）目标检测比赛思路、tricks集锦、资料汇总
（17）CVPR 2021 | GFLV2：目标检测良心技术，无Cost涨点！
（18）实用教程详解：用OpenCV的DNN模块部署YOLOv5目标检测
（19）干货实践 | Anchor 优化后在目标检测提升这么明显
（20）物体检测中的小物体问题
（21）大改 Yolo 框架 | 能源消耗极低的目标检测新框架（附论文下载）
（22）小目标检测：数据增强
（23）大盘点 | 2020年 2 篇异常算法最佳综述
（24）小目标检测：Feature Extraction
（25）工业图像异常检测最新研究总结（2019-2020）
（26）综述丨工业金属平面材料表面缺陷检测的研究进展
（27）详解基于深度学习的伪装目标检测
（28）基于 Caffe 格式部署 YOLOV5 模型
（29）#WACV 2021 FisheyeYOLO：用于自动驾驶的鱼眼相机上的通用物体检测。针对鱼眼图像中的物体检测，研究不同的物体表示方法中作者找到了更好的表示方法，如定向边界盒、椭圆和通用多边形。并设计了一种新型的曲线边界盒模型，该模型具有鱼眼畸变模型的最佳特性。FisheyeYOLO: Generalized Object Detection on Fisheye Cameras for Autonomous Driving单位 | 利默里克大学,Valeo论文 | /publication/346931586_FisheyeYOLO_Object_Detection_on_Fisheye_Cameras_for_Autonomous_Driving代码 | 暂未

（30）基于密度图的航空物体检测：理论与代码实现
（31）WACV 2021 论文大盘点-目标检测篇
（32）AAAI 2021中的目标检测（详细版with code）
（33）从L1 loss到EIoU loss，目标检测边框回归的损失函数一览
（34）#城市天眼# 由美国 Skylark Labs 公司开发，无人机安防监控，可在高空中（3-90米）对人群检测并分析行为，发现可疑活动。
来源：/i/status/1364086835266211843
（35）不用激光雷达，照样又快又准！3D目标检测之SMOKE
（36）理解物体检测中的Objectness

（37）目标检测一卷到底之后，终于有人为它挖了个新坑｜CVPR2021 Oral
（38）CVPR2021目标检测佳作 | Weighted boxes fusion（附github源码及论文下载）
（39）基于YOLOV4深度网络的车辆压实线检测算法
（40）56.4 AP！超越YOLOv4，更快更强的CenterNet2来了！
（41）CVPR2121目标检测 | 少见的知识蒸馏用于目标检测（附论文下载）
（42）用于自动驾驶的实时车道线检测和智能告警
（43）全新FPN！CE-FPN：通道增强特征金字塔网络，助力目标检测涨点！
（44）极市项目｜未拴绳遛狗识别算法需求
（45）基于YOLOV5深度网络模型的火焰检测
（46）基于YOLOV5深度网络模型的交通标志设施的模型训练
（47）基于深度学习YOLOV5网络的道路状况检测
（48）基于YOLOV5深度网络的公路病害检测
（49）使用Disentangling形式的损失函数回归2D和3D目标框
（50）CVPR 2021 | 腾讯AI Lab入选论文解读
（51）实操教程：android camera nanodet 实时物体检测的高效实现总结
（52）CVPR2021 目标检测佳作 | Weighted boxes fusion（附 GitHub 源码及论文下载）
（53）我扔掉FPN来做目标检测，效果竟然这么强！YOLOF开源：你只需要看一层特征｜CVPR2021
（54）【入门教程】异常检测（Anomaly Detection）到底是什么？
（55）最强检测 | YOLO V4?都是弟弟! CenterNet2以56.4mAP超越当前所有检测模型
（56）mmdetection性能简单优化方法
（57）目标检测一卷到底之后，终于有人为它挖了个新坑｜CVPR2021 Oral
（58）轻量高速检测器LFFD升级版LFD发布！用Pytorch部署，支持多类检测
（59）船舶检测 | 计算机视觉来看苏伊士运河堵船
（60）基于YOLOV4的印刷电路板PCB目标检测
（61）INT4量化用于目标检测
（62）超越YOLOv5！PP-YOLOv2：更快更好的目标检测网络
（62）Hugging Face发布PyTorch新库「Accelerate」：适用于多GPU、TPU、混合精度训练
（63）超越YOLOv5还不够！这个目标检测开源项目又上新了
（64）60.6 AP！打破COCO记录！微软提出DyHead：将注意力与目标检测Heads统一
（65）当YOLOv5遇见OpenVINO！
（66）OpenVINO™ 头部姿态评估网络应用演示
（67）实操教程｜YOLOv5实现自定义对象训练与OpenVINO部署全解析
（68）缺陷检测算法汇总（传统+深度学习方式）|综述、源码
（69）一文梳理水下目标检测方法
（70）不容忽视的问题：行人检测器的泛化能力
（71）让检测告别遮挡 | NMS-Loss是如何解决目标检测中的遮挡问题的？
（72）旋转目标检测 | 基于高斯 Wasserstein 距离损失的目标检测（附源代码）
（73）干货 | 利用像机图像通过卷积神经网络实时进行水稻检测（致敬袁老）
（74）MaskedFace-Net | 新冠疫情中的口罩检测（附论文及源代码）
（75）CVPR 2021 | 谷歌提出MobileDets：轻量化目标检测网络
（76）收藏 | 使用合成数据集做目标检测
（77）运动目标检测之-ViBe算法
（78）目标检测精选系列，目前最全的总结！（附论文下载）
（79）特别小的目标检测识别（附论文下载）
（80）新目标检测框架 | 基于改进的one-shot的目标检测
（81）PPCNN：细粒度特征提取和定位用于目标检测（附论文下载）
（82）基于深度学习的车道线检测算法
（83）CVPR实时移动端检测场景竞赛：字节跳动绝对优势夺冠
（84）极市项目｜物料空仓检测识别算法
（85）目标检测 | 基于统计自适应线性回归的目标尺寸预测
（86）YOLOF：速度和效果均超过YOLOv4的检测模型
（87）基于深度学习的公路病害检测方法研究
（88）OTA：目标检测中的最优传输分配
（89）目标检测干货 | 多级特征重复使用大幅度提升检测精度（文末附论文下载）
（89）基于图像处理的道路路面裂缝检测研究现状
（90）开源项目推荐 yolov5-face：

分类,重识别（主干网络）

（01）1.8M超轻量目标检测模型NanoDet，比YOLO跑得快，上线两天Star量超200
（02）中山大学提出新型行人重识别方法和史上最大评测基准
（03）ECCV 2020 论文大盘点-遥感与航空影像处理识别篇
（04）中山大学提出新型行人重识别方法和史上最大评测基准
（05）视频人员重识别：关系引导空间注意力 + 时间特征提取模型
（06）武汉大学等发布ReID最新综述！囊括三大视觉顶会，提出新基准方法AGW｜TPAMI2021
（07）中山大学提出新型行人重识别方法和史上最大评测基准
（08）全面升级！FastReID V1.0正式开源：Beyond reID
（09）最强ResNet变体！归一化再见！DeepMind提出NFNet，代码已开源！
（10）深度学习行人重识别综述与展望，TPAMI 2021 最新文章
（11）摄像机域内监督行人重识别问题
（12）WACV 2021 论文大盘点-图像分类篇
（13）WACV 2021 论文大盘点-图像与视频检索篇
（14）CVPR 2021 | 目标引导的人类注意力估计提升零样本学习
（15）大道至简！深度解读CVPR2021论文RepVGG！
（16）提出端到端的原型跨域自监督学习(PCS)框架，用于 Few-shot 无监督域适应(FUDA)。
（17）ResNet强势升级，仅改进训练和扩展策略便与EfficientNets一争高下

（19）CVPR2021|ACNet再进化，清华大学&旷视科技提出Inception类型的DBB
（20）时隔两年，EfficientNet v2来了！更快，更小，更强！
（21）89.77%准确率！谷歌提出CoAtNet：将卷积与自注意力结合
（22）CVPR 2021 Oral | 超越卷积的自注意力新模型！谷歌提出：HaloNet，又一超强视觉主干…
（23）高光谱图像的遥感图像分类研究现状以及问题
（24）谷歌提出「卷积+注意力」新模型，超越ResNet最强变体！
（25）全球首个开源图像识别系统上线了
（26）字节跳动获CVPR2021 细粒度图像竞赛双料冠军
（27）干货 | 阿里的图像搜索架构
（28）EfficientNetV2

语义目标分割

（01）NeurIPS 2020 Oral: 利用像素级别循环一致性来解决域适应语义分割问题
（02）性能提升30%以上！产业SOTA的实时实例分割算法SOLOv2，更快更强！
（03）CVPR 2020 论文大盘点-抠图 Matting 篇
（04）不用绿幕也能实时抠图，商汤等提出只需单张图像、单个模型的新方法MODNet
（05）性能提升30%以上，实时实例分割算法SOLOv2实现产业SOTA
（06）YolactEdge，首个边缘设备上实时实例分割法(Jetson AGX Xavier:30 FPS
（07）医学图像分割最佳方法的全面比较：U-Net和U-Net++
（06）MODNet 很容易以端到端的方式进行训练。它的速度比同期抠图方法快得多，运行速度为每秒 63 帧。

（07）该工作中，作者提出 BoxInst，可以只用实例包围框标注（而非实例掩码标注）
（08）作者将这一联合任务命名为深度感知视频全景分割，并为其提出了一个新的评估指标以及两个衍生数据集，并表示这些数据集将被公开。
（09）图像分割二十年，盘点影响力最大的10篇论文
（10）2020年「21篇」医学影像算法最佳综述
（11）重新思考语义分割范式：SETR
（12）一文读懂Image matting（图像抠图）
（13）大盘点 | 2020年5篇图像分割算法最佳综述
（14）大盘点 | 2020年「21篇」医学影像算法最佳综述
（15）【资源】全景分割相关资源大列表
（16）OpenVINO + OpenCV 实现车辆检测与道路分割
（17）超快速的端到端实例分割模型，手把手教你用opencv部署Yolact
（18）WACV 2021 论文大盘点-图像分割篇
（19）2020 CCF BDCI 地块分割Top1方案 & 语义分割trick整理
（20）首个 Text Matting（文本抠图）方法，灵活好用
（21）Transformer再突破！MedT：医学图像分割新网络
（22）CVPR 2021 | MSRA提出像素级别自监督预训练方法PixPro，大幅提升下游检测分割任务性能
（23）SG-net：一次视频实例分割的空间粒度网络
（24）Panoptic FCN：真正End-to-End的全景分割
（25）CVPR 2021 Oral | Transformer再突破！美团等提出VisTR：视频实例分割网络
（26）CVPR 2021 | 250 FPS！让实时语义分割飞起！重新思考BiSeNet
（27）顶刊TPAMI 2021！南开大学提出深度霍夫变换：语义线检测新方法
（28）Segmenter：基于纯Transformer的语义分割网络
（29）谷歌等新作：视觉Transformer的有趣特性
（30）视觉Transformer比CNN更鲁棒！IBM华人研究员新作
（31）更快更强！谷歌提出NesT：收敛更快、鲁棒更好的Transformer

（32）种实时，高分辨率的背景替换技术，可在4K分辨率下以30fps的速度运行，HD情况下以60fps的速度运行，代码已开源！
（33）港大&NVIDIA提出SegFormer：简单有效Transformer的语义分割新思路
（34）实操教程｜使用图像分割来做缺陷检测的一个例子
（35）CVPR2021佳作 | One-Shot都嫌多，Zero-Shot实例样本分割
（36）训练数据不需要手工标注分割，也能实现图像分割？
（37）CVPR2021 双图层实例分割，大幅提升遮挡处理性能
（38）Google发布语义分割新数据集！顺带开发个模型屠榜，已被CVPR2021接收

目标追踪

（01）收藏 | 多目标跟踪（MOT）入门
（02）单目标跟踪综述
（03）简单粗暴的多目标跟踪神器 – DeepSort
（04）结合重检测的长时目标跟踪
（05）目标跟踪又添重磅开源工具箱，MMTracking来了！
（06）遥感图像+CNN，预测区域人口收入水平
（07）目标追踪综述
（08）WACV 2021 论文大盘点-目标跟踪篇

（09）不经意的“走两步”就能锁定身份信息，这就是步态识别黑科技。
推荐一篇新出的综述，全面介绍了步态识别的发展，包含技术演进、主要数据集、现在技术达到的水平，了解深度学习步态识别的必读论文。
Deep Gait Recognition: A Survey /pdf/2102.

（10）#手部跟踪# 人手是极其灵活的，存在各种复杂的自接触和遮挡，给跟踪带来了困难。Facebook现实实验室近日发明了一种极其精确的人手跟踪方法，通过在视觉模型中加入物理特性限制达成。无论是单手还是双手，均可实现高度精确的跟踪。
Constraining Dense Hand Surface Tracking with Elasticity
主页 |/publications/constraining-dense-hand-surface-tracking-with-elasticity/

（11）TraDeS ：CVPR 2021多目标跟踪算法，改进了目前联合检测与跟踪的在线方法，使用跟踪线索辅助检测，在多个数据集实现了大幅精度提升，作者来自纽约州立大学。论文尚未公布，代码将开源。
Track to Detect and Segment: An Online Multi-Object Tracker
项目主页：/projects/

(12)基于尺度不变特征变换的多路监控视频拼接系统
（13）TCSVT2021：一种结合全局和局部细粒度特征的行人再识别方法
（14）基于SIFT尺度不变特征变换的图像拼接算法
（15）最新开源！TransReID：首个基于Transformer的ReID网络，各项任务全面领先！
（16）WACV2021论文解读-Scale Equivariance Improves Siamese Tracking
（17）端到端的多目标跟踪，代码将开源，Looking Beyond Two Frames: End-to-End Multi-Object Tracking Using Spatial and Temporal Transformers
（18）提出 SiamGAT，用于目标跟踪，性能领先许多当前先进跟踪器，达到 SOTA。
（19）TCSVT2021：一种结合全局和局部细粒度特征的行人再识别方法
（20）CVPR 2021 | 首个无需锚框（Anchor-Free）的行人搜索框架（附代码）
（21）基于YOLOV3与DeepSort的行人多目标跟踪
（22）从理论到实战！视频流车辆计数和目标跟踪
（23）TPAMI 2021 ：基于 event stream 的步态识别，准确率高达90%
（24）极市直播回放丨第80期-张新宇：CVPR 2021-Alpha Refine：通过精确的边界框估计提高跟踪性能
（25）目标跟踪入门篇-相关滤波

动作检测与识别

（01）MMAction2: 新一代视频理解工具箱
（02）WACV 2021 论文大盘点-人体动作检测与识别篇
（03）CVPR 2021 | 用于动作识别，即插即用、混合注意力机制的 ACTION 模块
（04）CVPR 2021 | 商汤提出最强时序动作提名修正网络：TCANet
（05）人体动作识别与生成：基于ST-GCN的方法
（06）刷爆HACS挑战赛时序动作检测榜单！TCANet：最强时序动作提名修正网络 CVPR 2021
（07）更快更强！视频理解模型PP-TSM重磅发布：速度比SlowFast快4.5倍
（08）视频异常行为检测算法MPN，在多个数据库上达到SOTA
（09）CVPR2021Oral #人体运动捕捉使用 4 个RGBD摄像头进行人体运动捕捉，在几何重建和纹理生成上效果都更好
（10）CVPR 2021 | 又好又快的视频异常检测，引入元学习的动态原型学习组件

姿态估算

（01）多人姿态识别框架——AlphaPose
（02）GitHub：人体姿态估计最全资料集锦
（03）人体姿态估计 (Human Pose Estimation) 常用方法总结
（04）CVPR2020 | 旷视研究院提出 PVN3D：基于 3D 关键点投票网络的单目 6DoF 位姿估计算法
（05）人体姿态估计、识别与生成最新技术一览
（06）深度学习人体姿态估计：2014-2020全面调研
（07）最新开源：端到端6D物体姿态跟踪，无需标注数据集！
（08）手势识别基础～手势骨架与关键点提取
（09）动物姿态估计！马、老虎、牛、鹿、狗狗的姿态都能搞定！斩获CVPR 2021 Oral
（10）OpenVINO™ 头部姿态评估网络应用演示
（11）CVPR 2021 | 微软提出"解构式关键点回归"，刷新COCO自底向上多人姿态检测记录！

OCR

（01）万字长文 | 图表示学习中的Encoder-Decoder框架
（02）霸榜Github：又一款OCR神器面世！
（03）新视角：用图像分类来建模文字识别也可以SOTA
（05）都2021了，别再堆砌网络了！10万奖金悬赏最强轻量化OCR模型
（06）顶刊TPAMI 2021！PAN++：精确高效的任意形状文本检测与识别
（07）最新！CVPR 2021 OCR领域论文大盘点（22篇）
（08）论文推荐｜【KSII TIIS 2021】DP-LinkNet：一种用于古籍文档图像二值化的卷积网络(有源码)

3D,深度估算,点云,SLAM

（01）CVPR2020 | 3D 目标检测新框架：3DSSD
（02）CenterFusion：融合雷达与摄像头数据的高精度3D目标检测
（03）最佳论文！商汤提出手机端实时单目三维重建系统 | ISMAR 2020

（04）商汤提出手机端实时单目三维重建系统，实现逼真AR效果和交互
（05）基于深度学习的图像匹配技术一览
（06）极市直播｜AAAI’21杰出论文许鸿斌：一个解决三维重建对数据依赖的新框架（已开源）
（07）OpenCV再升级！修改一行代码，将图像匹配效果提升14%！
（08）重磅！谷歌开源TensorFlow 3D场景理解库
（09）极市直播回放丨第76期-许鸿斌：AAAI’21杰出论文，一个解决三维重建对数据依赖的新框架（已开源）
（10）可用于大规模点云表面重建的深度学习算法
（11）可用于大规模点云表面重建的深度学习算法

（12）深度估计是机器人和自动驾驶研究的重要内容，而这往往需要特殊设备，如RGB-D相机或激光雷达，如何使用RGB相机感知深度呢？研究人员曾经做了很多的尝试。该视频是CVPR 2021论文Depth from Camera Motion and Object Detection结果，通过使用“普通手机摄像头运动+目标检测的包围框”数据，设计RNN网络实现了达到最先进精度的目标深度估计。单位 | 密歇根大学，史蒂文森理工学院论文 | /abs/2103.01468代码 | /griffbr/ODMD
（13）CVPR 2021 | TPCN 点云就是这么美妙
（14）一文了解激光点云的组织形式
（15）基于YOLO的新型RGB-D融合方法对行人进行检测和3D定位
（16）ECCV2020 | 夜间图像的无监督单目深度估计
（17）MVSNeRF: Fast Generalizable Radiance Field Reconstruction from Multi-View Stereo
（18）在 KITTI 基准数据集上实现最先进的单目3D目标检测结果，表现与基于单目视频的方法相当。
（19）真正实用的退化模型：ETH开源业内首个广义盲图像超分退化模型，性能效果绝佳
（20）ResNet也能用在3D模型上了！清华计图首创三角网格面片上的卷积神经网络：SubdivNet
（21）开源｜AAAI‘21杰出论文-三维重建新探索：解决数据依赖问题，让自监督信号更可靠！
（22）综述：基于点云的自动驾驶3D目标检测和分类方法
（23）PatchmatchNet：一种高效multi-view stereo框架 (CVPR2021 Oral)
（24）CVPR2021｜神经网络如何进行深度估计？
（25）DXSLAM：一种基于深度特征的鲁棒且高效的视觉SLAM系统
（26）实时高分辨率 RGB-D表面重建（CVPR2021）
（27）Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪
（28）HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法
（29）基于点云的3D障碍物检测
（30）极市直播丨朱思语：基于深度学习的视觉稠密建图和定位
（31）基于3D Surfel图的单目直接法稀疏定位
（32）将合成 3D 场景表示合并到生成模型中，从而实现更可控的图像合成。
（33）传统单图像深度估计往往只能给出低分辨率结果，细节也不够丰富，视觉上总给人模糊不清的感觉，来自SFU和Adobe的研究者通过合并不同分辨率生成高分辨率的深度估计，终于可以还原清晰的细节。
（34）OmniPhotos，目前最快的360°全景VR摄影方法。代码已开源。
（35）作者提出并集成GrooMeD-NMS–一种新颖的分组数学可区分的NMS，用于单眼3D物体检测，
（36）CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

GUN（图像生成,超分辨,动作迁移）

（01）CVPR 2020 论文大盘点-图像增强与图像恢复篇
（02）哈工大等提出轻量级盲超分辨模型LESRCNN，代码已开源
（03）最新！图像去噪综合比较研究
（04）无需用户输入，Adobe提出自动高质量图像合成新方法
（05）NVIDIA Research的研究人员提出了一种自适应鉴别器增强机制，该机制可显着稳定有限数据环境中的训练。
（06）照片秒变卡通风！教你用PaddleGAN快速生成你的专属卡通头像
（07）精准生成Fake人脸！Amazon全新GAN模型给你全方位无死角美颜
（08）博士后姐把“二次元老婆生成器”升级了！AniGAN：这一次可以指定画风
（09）训练 GANs 一年我学到的 10 个教训
（10）涵盖 18+ SOTA GAN 实现，这个开源工程 PyTorch 库火了
（11）6ms 的EfficientDeRain：颇具启发的简单高效去雨算法
（12）PULSE:一种基于隐式空间的图像超分辨率算法
（13）解决以往单图像超分辨率算法仅在合成数据上效果好，无法适用于真实场景的问题。无需对特定类型相机图像训练，即可泛化到不同的相机上。Exploiting Raw Images for Real-Scene Super-Resolution单位 | 卡内基梅隆大学，商汤，加州大学论文 | /pdf/2102.代码 | /s/a66iuwoswul65da/RawSR_PAMI20.zip?dl=0主页 | /view/xiangyuxu/rawsr_pami
（14）下一代更衣室！国外一位设计师做的虚拟试衣应用。基于OpenPose 进行2D关节点跟踪，使用 Houdini 特效渲染。
来源：/articles/next-gen-dressing-room-with-markerless-tracking-in-houdini/

（15）#GAN #WACV2021
SinGAN-GIF 可以生成任意长宽比的样本，进行超分辨率，改变时帧率，并可用于视频编辑应用。
SinGAN-GIF: Learning a Generative Video Model From a Single GIF
作者 | Rajat Arora, Yong Jae Lee
单位 | 加利福尼亚大学戴维斯分校
论文 |
/content/WACV2021/papers/Arora_SinGAN-GIF_Learning_a_Generative_Video_Model_From_a_Single_GIF_WACV_2021_paper.pdf
主页 | /singan-gif/

（16）WACV 2021 论文大盘点-图像质量篇

（17）Morph-UGATIT：一种支持渐进式域迁移的图像翻译方法
（18）近日由加州大学圣迭戈分校、CMU、Facebook 提出的一种极快速的视频插帧方法，比之前最精确的方法快384倍，比之前最快的8倍插值方法快23倍。该视频为使用该方法得到的慢动作影像。代码将开源。
FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation
units | 加利福尼亚大学圣迭戈分校；卡内基梅隆大学；Facebook AI
paper | /abs/2012.08512
github | coming
home | /FLAVR/

（19）浙大等学者发明的Neural Body算法，输入多角度视频可输出3D人体和新角度视图。论文 | /pdf/2012.代码 | /zju3dv/neuralbody（即将）

（20）CVPR 2021接收论文：AdCo基于对抗的对比学习

（21）第一个同时采用传感器数据和图像进行视频稳定的 DNN 解决方案。Deep Online Fused Video Stabilization单位 | 威斯康星麦迪逊大学，谷歌论文 | /abs/2102.01279代码 | 即将主页 | /dvs/

（22）浙大等学者发明的Neural Body算法，输入多角度视频可输出3D人体和新角度视图。论文 | /pdf/2012.代码 | /zju3dv/neuralbody（即将）

（23）TIP 2021论文：多曝光图像融合及超分辨的联合实现
（24）CVPR 2021 Oral｜只用静态图像，就能实时渲染出丝滑3D效果
（25）智趣丨实时风格迁移，移动端运行，人脸特效又有了新玩法
（26）CVPR 2021 | 港科大：如何利用闪光图像(flash image)来去除反光？
（27）CVPR 2021 | Neighbor2Neighbor：仅需噪声图像即可训练任意降噪网络的方法
（28）多功能的图像超分辨模型：用于盲图像超分辨的非对称卷积神经网络
（29）深度图像修复的一个突破
（30）GANSpace: Discovering Interpretable GAN Controls
（31）TIP2021| 视频超分辨率中的多级特征融合网络
（32）rtFlow: Unbiased Image Style Transfer via Reversible Neural Flows提出 ArtFlow 来防止通用风格迁移过程中的 content leak（内容泄漏）。ArtFlow 由可逆的神经流和无偏的特征迁移模块组成。同时支持前向和后向推理，并采用投影-转移-还原的方案进行操作。ArtFlow 在避免 content leak（内容泄漏）的同时，实现了与最先进的风格迁移方法相当的性能。
（33）极市直播丨邓欣：TIP 2021-多曝光图像融合及超分辨的联合实现方法
（34）Weather GAN：实现晴、阴、雾、雨、雪之间的天气状况*迁移
（35）CVPR 2021 | 五官画风都能改，用无监督方法控制 GAN (附源码) -周博磊团队
（36）CVPR 2021｜Neighbor2Neighbor：无需干净图像的自监督图像降噪
（37）图像反光能被一键去除了？港科大开源RFC，仅用一个操作，强反光也能完美去除｜CVPR2021
（38）你好，这是微视AI还原的李焕英
（39）有限数据来训练GAN的一种思路
（40）揭秘腾讯微视人脸技术「黑科技」，基于GAN的人脸魔法特效
（41）添加链接描述
（42）CVPR2021｜超分性能不降低，计算量降低50%，董超等人提出加速图像超分的ClassSR
（43）RealSR性能大幅提升！旷视+快手+电子科大联合提出“先发散再收敛”的D2CSR
（44）仅需2张图！AI便可生成完整运动过程
（45）PornHub 用独家数据集！修复了百年前的电影…
（46）新垣结衣夫妇的孩子会长啥样？我用BabyGAN预测试试…
（47）刚刚！AMD发布超分辨率新技术FSR：N卡也能用
（48）Transformer再下一城！ETH提出：视频超分辨率Transformer
（49）蔡徐坤x特xxx梦幻联动！这个神器能让图像实时模仿人的动作
（50）人人皆可二次元！这个GAN网络让小姐姐生成不同风格的动漫形象！肤色、发型皆可变
（51）这款AI神器，让父亲重返18岁！
（52）DSRL：灵活而简单的框架,提高网络精度的且不引入额外的计算量,CVPR2020
（53）实时 4K “image-to-image translation”，港理工&达摩院张磊团队提出拉普拉斯金字塔变换网络
（54）NBNet：抛开复杂的网络结构设计，旷世&快手提出子空间注意力模块用于图像降噪
（55）开源 | 性能炸裂，旷视提出适用于底层问题的Half Instance Normalization
（56）GNN 模型在生物化学和医疗健康中的典型应用
（57）超强面经：文本检测与GAN篇（含答案）
（58）CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性
（59）LeCun点赞！GAN模型130毫秒生成动漫肖像！
（60）Deepfake文字版横空出世：AI高仿你的笔迹只需1个词！
（61）【开源】对基于图像背景的字体生成、人体姿势预测、关键点检测、超分辨率等探讨
（62）/PhotorealismEnhancement/
（63）图像填充不怕区域大！MSRA等提出协同调制生成对抗网络
（54）CVPR 2021 Oral | GLEAN: 基于隐式生成库的高倍率图像超分辨率
（55）技压群雄！2021 NTIRE @CVPR 2021的三冠一亚视频超分方案：BasicVSR++

GNN（图神经相关）

（01）ECCV 2020 论文大盘点-图像视频修复篇
（02）详解：多模态知识图谱种类及其应用
（03）Facebook@ICLR2021：GNN中加入标签传播，训练时间直降100倍

Transformer

（01）Transformer 再下一城，Facebook 等提出多目标跟踪算法 TrackFormer
（02）全文翻译 | 华为、北大、悉尼大学：最新视觉Transformer综述（2017-2020年）
（03）计算机视觉中的Transformer
（04）Transformer 最新应用，3D 点云处理，实现 S3DIS 数据集场景分割mIoU首次突破 70% ！

（05）用Pytorch轻松实现28个视觉Transformer，开源库 timm 了解一下！（附代码解读）
（06）一文看懂9种Transformer结构
（07）更深、更轻量级的Transformer！Facebook提出：DeLighT
（08）刷爆AI圈！基于Transformer的DALL-E代码刚刚开源了
（09）Transformer又来了！这个谷歌3D大法闻歌起舞，流畅且自然！
（10）视觉Transformer之简单总结
（11）效果远超Transformer！AAAI 2021最佳论文Informer：最强最快的序列预测神器
（12）Transformer携手Evolving Attention在CV与NLP领域全面涨点！
（13）无卷积！金字塔视觉Transformer(PVT)：用于密集预测的多功能backbone
（14）CVPR 2021 | Transformer进军low-level视觉！北大华为等提出预训练模型IPT
（15）CVPR 2021 Oral | Transformer再发力！华南理工和微信提出UP-DETR：无监督预训练检测器
（16）搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（二）
（17）CNN与Transformer的强强联合！谷歌最新开源BoTNet，ImageNet达84.7%准确率
（18）ResNet被全面超越了，是Transformer干的：依图科技开源“可大可小”T2T-ViT，轻量版优于MobileNet
（19）来自Transformer的降维打击：ReID各项任务全面领先，阿里&浙大提出TransReID
（20）论文速递：金字塔Transformer，更适合稠密预测任务的Transformer骨干架构
（21）视觉 Transformer 的可视化｜CVPR2021
（22）美团提出具有「位置编码」的Transformer，性能优于ViT和DeiT
（23）刷爆AI圈！基于Transformer的DALL-E代码刚刚开源了
（24）CVPR2021 | 用Transformers无监督预训练进行目标检测
（25）CVPR2021 | 用Transformers无监督预训练进行目标检测
（26）Facebook首发时空Transformer 训练速度远超3D CNN！
（27）添加链接描述
（28）CVPR 2021 | Transformer再下一城！复旦等提出SETR：语义分割网络
（29）霸榜各大CV任务榜单，Swin Transformer横空出世！
（30）/abs/2103.14803
（31）On the Adversarial Robustness of Visual Transformers论 Visual Transformers 的对抗鲁棒性
（32）Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers
（33）CrossViT: Cross-Attention Multi-Scale Vision Transformer for Image Classification用于图像分类，代码将开源
（34）HiT: Hierarchical Transformer with Momentum Contrast for Video-Text Retrieval用于视频文本检索
（35）TransCenter: Transformers with Dense Queries for Multiple-Object Tracking用于多目标跟踪，代码将开源
（36）TFPose: Direct Human Pose Estimation with Transformers用于人体姿态估计，代码开源
（37）Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding
（38）/p/361092528
（39）/p/361059921
（40）新论文石锤Transformer：别只看注意力，没有残差和MLP，它啥都不是
（41）CNN再助力！CoaT：Co-Scale卷积-注意力图像Transformer
（42）复旦提出M2TR：首个多模态多尺度Transformer
（43）吴恩达真顶流！新增Transformer！深度学习课程更新，近60万人报名…
（44）Twins：重新思考视觉Transformer中的空间注意力机制
（45）屠榜各大CV任务！「百度顶会论文复现营」携Swin Transformer来袭！
（46）重磅开源！Twins：更高效的视觉Transformer主干网，完美适配下游检测、分割任务
（47）Transformer的中年危机
（48）Transformer再下一城！厦大等提出ISTR：端到端实例分割
（49）Transformer再下一城！Swin-Unet：首个纯Transformer的医学图像分割网络
（50）谷歌用傅里叶变换替换Transformer自注意力层！在GPU上快7倍、TPU上快2倍…
（51）DeepViT：迈向更深的视觉Transformer
（52）超越PVT！南大提出ResT：高效多尺度的视觉Transformer
（53）超越PVT！南大提出ResT：高效多尺度的视觉Transformer
（54）Transformer再下一城！DeepMind新模型自动生成CAD草图，网友：建筑设计要起飞了
（55）重新思考：在ResNet与Transformer均适用的跳跃连接
（56）最新！CVPR 2021 视觉Transformer论文大盘点（43篇）
（57）Transformer再下一城！low-level多个任务榜首被占领，中科大等联合提出：Uformer
（58）清华提出DynamicViT：动态Token稀疏化的高效视觉Transformer
（59）超越StyleGAN！TransGAN更新！用纯Transformer构建高分辨率GAN
（60）不是所有图像都值16x16个词！清华&华为提出DVT：动态视觉Transformer
（61）腾讯提出Shuffle Transformer：重新思考视觉Transformer的空间Shuffle
（62）Transformer杀疯了！竟在图神经网络的ImageNet大赛中夺冠，力压DeepMind、百度…
（63）谷歌大脑新作：教你训练自己的视觉Transfomer模型
（64）南开&阿里提出P2T：基于金字塔池化的视觉Transformer！可用于各类下游场景理解任务！
（65）谷歌新作：视觉Transformer超越ResNet！！！从头开始训练！
（66）Apple新作：没有注意力的Transformer依然是顶流！！！
（67）超越PVT！南大提出ResT：高效多尺度的视觉Transformer
（68）浙大&华为等提出VTP：首个用于视觉Transformer的剪枝方法
（69）Transformer 进行端到端的目标检测及跟踪（附源代码）
（70）如何看待无监督学习在 vision transformer 上的应用前景？
（71）你仅需要看一个序列！YOLOS：重新思考Transformer的泛化性能
（72）通用性 Transformer 基石视觉架构，带来大范围性能提升！（附项目地址）
（73）基于 detectron2 实现的 PVT 开源了；可用于密集任务 Backbone 的金字塔视觉 transformer
（74）搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（九）
（75）极市直播丨陈鑫：CVPR 2021-TransT: 基于Transformer的高性能单目标跟踪算
（76）打破Transformer宿命，新秀VOLO开源！横扫CV多项记录，首个超越87%的模型
（77）OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测
（78）各类Transformer都得稍逊一筹，LV-ViT：探索多个用于提升ViT性能的高效Trick
（79）利用TRansformer进行端到端的目标检测及跟踪（附源代码）
（80）COTR 一种基于Transformer的图像匹配网络
（81）谷歌AI用30亿数据训练了一个20亿参数Vision Transformer模型，在ImageNet上达到新的SOTA！
（82）FcaNet：从频域角度重新思考注意力机制
（83）重磅开源！Twins：更高效的视觉Transformer主干网，完美适配下游检测、分割任务
（84）将Transformer引入CV届的Facebook 这次又有新发现：自监督学习 + Vision Transformers更配！

半监督，无监督，强化学习

（01）伪标签还能这样用？半监督力作UPS（ICLR 2021）大揭秘！
（02）深度学习中的3个秘密：集成，知识蒸馏和自蒸馏
（03）伪标签还能这样用？半监督力作UPS（ICLR 2021）大揭秘！
（04）从 SimCLR 到 BarLow Twins ，一文了解自监督学习不断打脸的认知发展史
（05）从4篇顶会论文看Self-training最新研究进展
（06）大盘点 | 何恺明团队在自监督领域的工作：MoCo三部曲
（07）CVPR 2021 Oral | 妙啊！不怕遮挡的图像线段匹配 SOLD2，还能联合自监督线段检测
（08）CVPR 2021 | 何恺明等人新作！深入探究无监督时空表征学习
（09）超越SEED！腾讯优图提出DisCo：拯救小模型在自监督学习中的效果
（10）CVPR 2021 | 突破性研究！将自监督学习应用到自动驾驶上
（11）LeCun联手华人博士后提出自监督学习新作！却遭Reddit网友质疑：第一张图就错了…
（12）CVPR 2021 | 北大&MSRA提出CPS：基于交叉伪监督的半监督语义分割
（13）深度了解自监督学习，就看这篇解读！Hinton团队力作：SimCLR系列

模型优化,压缩,加速，NAS（网络搜索），注意力机制

（01）超越MobileNetv3！Facebook提出FP-NAS：搜索速度快，精度更高添加链接描述
（02）如何简单有效地实现迁移学习？ECCV 2020 论文介绍
（03）超越 EfficientNet与MobileNetV3，NeurIPS 2020 微软NAS方向最新研究
（04）模型压缩新突破，刷新滤波器剪枝的SOTA效果，优图NeurIPS 2020论文
（05）从频域角度重新思考注意力机制——FcaNet
（06）即插即用！视频超分中的涨点神器：iSeeBetter
（07）可变形卷积的深度思考
（08）真正的即插即用！盘点11种CNN网络设计中精巧通用的“小”插件
（10）深度学习模型压缩与加速综述
（11）量化新方：模型压缩 6 倍，无需重训练
（12）用20篇论文走完知识蒸馏在 2014-2020 年的技术进展
（13）基于TensorRT量化部署YOLOV5s 4.0模型
（14）推理实践落地 | 最详细的 Pytorch 底层算子扩展总结（文末附源码）
（15）教程：基于TensorRT完成NanoDet模型部署
（16）基于深度学习的图像与视频压缩
（17）深度学习精度提升 3 个小妙招：模型集成、知识蒸馏、自蒸馏
（18）CVPR2021深度框架训练 | 不是所有数据增强都可以提升最终精度
（19）CVPR 2021 | KeepAugment：一种简单的信息保存数据扩增方法, 助力分类/分割/检测涨点！
（20）CVPR Oral：我给大家表演一个无中生有｜北航商汤耶鲁
（21）CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式
（22）动态滤波器卷积新高度！DDF：同时解决内容不可知与计算量两大缺陷｜CVPR 2021
（23）Attention九层塔：注意力机制的九重理解
（24）CNN可视化又添新作！南大提出Group-CAM：高效的显著图生成方法
（25）超越自注意力！清华提出EA和EAMLP：使用两个线性层的新注意力机制
（26）即插即用！浙大&港中文提出CompConv卷积：让模型不丢精度还可以提速
（27）深度学习中的 Attention 机制总结与代码实现（2017-2021年）
（28）基于深度学习的图像增强综述
（29）完全解析 RNN, Seq2Seq, Attention 注意力机制
（30）综述 | 注意力机制
（31）CVPR 2021 | 超越卷积，自注意力模型HaloNet
（32）CVPR 2021 | 基于随机标签的神经架构搜索
（33）这可能是最强的AI算法可视化神器！

数据集,比赛,标注工具,实用工具

（01）CVPR 2020 算法竞赛大盘点
（02）不规则四边形坐标的标注工具（可用于车牌 / OCR / 人脸关键点）
（03）从3D人脸到自动驾驶，CVPR2020十个*开源数据集
（04）80GB医学影像数据集发布！OCTA-500公开下载
（05）火爆GitHub！3.2k Star的可视化神器开源！
（06）近距离看CNN训练！360度可视化，网友：美得不真实
（07）Tianchi 完整开源数据集！
（08）RTX 3090的深度学习环境配置指南：Pytorch、TensorFlow、Keras
（09）擦除：提升 CNN 特征可视化的 3 种重要手段
（10）50万奖金，10亿像素，这个目标检测与跟踪可不简单
（11）超2000万图片，全球最大人眼图像数据集开源了
（12）#大场景目标检测比赛# PANDA 行人、车辆多目标检测数据已开放下载，今天初赛正式开赛啦！
总计7G的数据集和相关标注，PANDA-Image由 555 张静态十亿像素图片组成，总共包含21个不同的场景，其中Training集包括390张图片。
报名链接：/s/be6691073b92dc4f2c2f230db97af7f5
技术解读：/s/AYW7_yJjKv3dmkYJEJDJNg

（13）终于来了！我们发布了 PAKDD 2021 智能运维大赛 baseline
（14）RankDataset：超大规模数据集加载利器
（15）史上最全RGB-D数据集在这里！附详细对比下载文档！
（16）10万奖励+10万数据集！垃圾分类/表情识别等赛事全面启动！2021高通人工智能应用创新大赛来了
（17）ImageNet验证集6%的标签都是错的，MIT：十大常用数据集没那么靠谱
（18）PANDA行人和车辆多目标检测方案及baseline代码
（19）10万+数据集，表情识别/农作物病虫害识别/垃圾分类识别/手绘图像识别四大赛题等你挑战
（20）CVPR 2021 | Short-video Face Parsing Challenge 开赛，数据集已开放！
（21）54万奖金！目标检测新赛事！百度发起"智能交通检测"大赛
（22）CVPR 2021商品识别竞赛来了！阿里达摩院主办
（23）31万奖金！目标检测新赛事！第六届信也科技杯智能零售算法大赛来了
（24）ICCV 2021 | 规模最大的戴口罩人脸识别比赛启动！
（25）ICCV 2021 | 首个大规模视频语义分割比赛启动！
（26）10万奖金池！OpenMMLab算法生态大赛正式启动！
（27）动作检测/定位/解析三大赛道！ICCV 2021 DeeperAction挑战赛来了

（28）神仙打架丨NTIRE2021视频超分挑战双赛道方案
（29）3D人体目标检测与行为分析竞赛开赛，奖池7万+，数据集达16671张！

杂项

（01）MultiPoseNet:人体检测、姿态估计、语义分割一 “网” 打尽
（02）10 个开源 Python OpenCV 小项目，YouTube热门
（03）图像算法可以稳定处理视频了！港科大开源通用算法，解决视频处理时域不稳定问题｜NeurIPS 2020
（04）性能SOTA、适用多种类型物体，国防科技大学单张RGB-D图像预测物体对称性
（05）遥感图像+CNN，预测区域人口收入水平
（06）清华&旷视提出RepVGG：让你的CNN一卷到底！
（07）RepVGG：极简架构，SOTA性能，让VGG式模型再次伟大！
（08）ICLR 2021 | SEED：自监督蒸馏学习，显著提升小模型性能！
（09）麻省理工新框架 | MIT 开源高性能自动微分框架，速度提升 4.5 倍（附框架源码）
（10）多模态深度学习：用深度学习的方式融合各种信息
（11）AdvProp：两组Batch Normalization助你在CNN对抗训练中高效涨点
（12）顶刊TPAMI 2021 | 换个损失函数就能实现数据扩增？
（13）旷视提出MomentumBN：缓解自监督学习的大batch要求，涨点明显！
（14）涨点神器！南京大学提出IC Networks：对CNN的基础单元重新建模
（15）涨点神器！重新标记ImageNet，让CNN涨点明显！代码已开源
（16）DeepMind重新设计高性能ResNet！无需激活归一化层
（17）泛化神器！李沐等人提出两种正则化技术：在CV和NLP均有大幅度提升
（18）CVPR 2021 | RepVGG：极简架构，SOTA性能，让VGG式模型再次伟大！
（19）CVPR 2021 | 涨点神器！IC-Conv：使用高效空洞搜索的Inception卷积，全方位提升！
（12）CVPR 2021 | 即插即用！ CA：新注意力机制，助力分类/检测/分割涨点！
（13）ICLR2021 Oral｜9行代码提高少样本学习泛化能力，代码已开源
（24）综述：轻量级CNN架构设计
（25）将位置信息嵌入通道注意力！NUS提出新机制，显著提升卷积特征表达｜CVPR2021
（26）添加链接描述CVPR2021 佳作 | 重新标记 ImageNet：从全局标签到局部标签（附 GitHub 代码及论文）
（27）重新标注 ImageNet：多标签，全面提升模型性能
（28）刚刚！频域通道注意力网络FcaNet开源了！
（29）我卷我自己——cvpr2021：Involution
（30）白给的性能不要？cvpr2021-Diverse branch block
（31）极市沙龙回顾｜CVPR2021-李铎：通过反转卷积的内在性质进行视觉识别
（32）DO-Conv无痛涨点：使用over-parameterized卷积层提高CNN性能
（33）动态卷积超进化！通道融合替换注意力，减少75%参数量且性能显著提升 ICLR 2021
（34）CVPR’21 | Involution：超越卷积和自注意力的神经网络新算子
（35）【新Attention】最强的Attention函数诞生啦，带给你意想不到的巨大提升！
（36）ICML 2021 (Long Oral) | 深入研究不平衡回归问题
（37）谷歌大脑新工作：把注意力放在MLP上！
（38）ICML 2021 | 稀疏训练新方法：In-Time Over-Parameterization
（40）清华提出RepMLP：FC“内卷”，卷出性能！
（41）图灵奖得主Bengio又出新论文：用强化学习提升模型泛化性！网友崩溃：idea撞车了…
（42）一文看尽深度学习中的20种卷积（附源码整理和论文解读）
（43）干货｜深度学习中的重参数技巧
（44）登上更高峰！颜水成、程明明团队开源ViP，引入三维信息编码机制，无需卷积与注意力
（45）最新视频防抖论文精选 + 开源代码汇总
（46）CVPR 2021 | 任何人都能“不讲武德”，姿态可控的语音驱动说话人脸
（47）CV圈杀疯了！继谷歌后，清华、牛津等学者又发表三篇MLP相关论文，LeCun也在发声
（48）领域泛化最新综述
（49）实践教程｜利用CNN来检测伪造图像
（50）介绍一种新的激活函数族ACON
（51）CVPR 2021 图像压缩最新进展
（52）Google发布语义分割新数据集！顺带开发个模型屠榜，已被CVPR2021接收
（53）CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

文章阅读

（01）LS-Net：单双目视觉的非线性最小二乘学习算法
（02）GNN、RL强势崛起，CNN初现疲态？这是ICLR 2021最全论文主题分析
（03）何恺明团队最新力作SimSiam：消除表征学习“崩溃解”，探寻对比表达学习成功之根源
（04）简洁的架构还能高效和准确？清华&华为提出新型残差循环超分模型：RRN！
（05）华为北大等联手打造的Transformer竟在CV领域超过了CNN：多项底层视觉任务达到SOTA
（06）腾讯微视模型 | 单模型史上最佳成绩，（BLENDer）登顶权威榜单VCR
（07）令人“细思极恐”的Faster-R-CNN
（08）ACCV 2020 最受关注的 Top10 代码开源论文!

（09）详解：多模态知识图谱种类及其应用
（10）噪声样本优秀论文综述（2017-2020）
（11）当频域（DCT）遇见CNN
（11）小哥质疑谷歌顶会CV论文有错！并且拿出了复现代码来证明
（12）深入研究模型压缩经典Ghostnet：如何用少量计算生成大量特征图？
（13）AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！
（14）深度学习的目标检测算法是如何解决尺度问题的？
（15）图解RepVGG
（16）详解：多模态知识图谱种类及其应用
（17）激活还是不激活？CVPR2021-Activate Or Not: Learning Customized Activation
（18）当CV遇上联邦学习！FedVision：首个轻量级、可扩展的视觉联邦开源框架
（19）深度学习前人精度很高了，该怎么创新？
（20）谷歌AI研究院：被低估的数据！被高估的模型…
（21）新坑来了！谷歌提出MLP-Mixer：一种纯MLP构成的视觉架构
（22）我为中国第一张火星照片做鱼眼矫正
（23）同行评审就是个笑话！Nature爆料：计算机生成的垃圾文章竟还能被接受，64%来自中国
（24）视觉架构大一统！港中文提出：Container，对CNN、Transformer和MLP-Mixer进行了大一统
（25）真·自行车！华为天才少年刚刚「发布」了一款无人驾驶自行车，网友：这TM不比特斯拉燃？
（26）论文无法复现！真公开处刑！PapersWithCode上线「论文复现报告」
（27）2021年，深度学习还有哪些未饱和、有潜力且处于上升期的研究方向？
（28）波士顿动力机器狗打工这一年
（29）无人驾驶车辆跟踪技术研究介绍

在这里插入图片描述

秒客网

2021计算机视觉-包揽所有前沿论文源码 -上半年

文章分类

人脸技术

目标检测

分类,重识别（主干网络）

语义目标分割

目标追踪

动作检测与识别

姿态估算

OCR

3D,深度估算,点云,SLAM

GUN（图像生成,超分辨,动作迁移）

GNN（图神经相关）

Transformer

半监督，无监督，强化学习

模型优化,压缩,加速，NAS（网络搜索），注意力机制

数据集,比赛,标注工具,实用工具

杂项

文章阅读

相关文章

2021计算机视觉-包揽所有前沿论文源码 -上半年

文章分类

人脸技术

目标检测

分类,重识别（主干网络）

语义目标分割

目标追踪

动作检测与识别

姿态估算

OCR

3D,深度估算,点云,SLAM

GUN（图像生成,超分辨,动作迁移）

GNN（图神经相关）

Transformer

半监督 ，无监督，强化学习

模型优化,压缩,加速，NAS（网络搜索），注意力机制

数据集,比赛,标注工具,实用工具

杂项

文章阅读

相关文章

半监督，无监督，强化学习