文件名称:TransPose:转位
文件大小:2.41MB
文件格式:ZIP
更新时间:2024-04-28 08:09:50
Cuda
介绍 是基于CNN特征提取器,变压器编码器和预测头的人体姿态估计模型。 给定一张图像,Transformer中内置的注意层可以捕获关键点之间的长期空间关系,并解释预测的关键点位置高度依赖于哪些相关性。 模型动物园 我们选择两种类型的CNN作为骨干候选者:ResNet和HRNet。 派生的卷积块是ResNet-Small,HRNet-Small-W32和HRNet-Small-W48。 模型 骨干 #注意层 d H #元首 #Params AP(coco val gt bbox) 下载 TransPose-R-A3 ResNet-S 3 256 1024 8 5.2兆 73.8 TransPose-R-A4 ResNet-S 4 256 1024 8 6.0兆 75.1 转运体 HRNet-S-W32 4 64 128 1个 8.0兆 76.1
【文件预览】:
TransPose-main
----.gitignore(2KB)
----requirements.txt(124B)
----experiments()
--------coco()
----LICENSE(1KB)
----tools()
--------jit_handles.py(9KB)
--------_init_paths.py(739B)
--------compute_flops.py(3KB)
--------test.py(5KB)
--------flop_count.py(6KB)
--------train.py(7KB)
----README.md(8KB)
----transpose_architecture.png(463KB)
----lib()
--------core()
--------Makefile(116B)
--------dataset()
--------nms()
--------models()
--------utils()
--------config()
----attention_map_image_dependency_transposeh_thres_0.0.jpg(568KB)
----hubconf.py(5KB)
----attention_map_image_dependency_transposer_thres_0.0.jpg(467KB)
----attention_map_image_dependency_transposeh_thres_0.00075.jpg(461KB)
----attention_map_image_dependency_transposer_thres_0.01.jpg(391KB)