【文件属性】:
文件名称:TransPose:转位
文件大小:2.41MB
文件格式:ZIP
更新时间:2021-04-08 14:23:10
Cuda
介绍
是基于CNN特征提取器,变压器编码器和预测头的人体姿态估计模型。 给定一张图像,Transformer中内置的注意层可以捕获关键点之间的长期空间关系,并解释预测的关键点位置高度依赖于哪些相关性。
模型动物园
我们选择两种类型的CNN作为骨干候选者:ResNet和HRNet。 派生的卷积块是ResNet-Small,HRNet-Small-W32和HRNet-Small-W48。
模型
骨干
#注意层
d
H
#元首
#Params
AP(coco val gt bbox)
下载
TransPose-R-A3
ResNet-S
3
256
1024
8
5.2兆
73.8
TransPose-R-A4
ResNet-S
4
256
1024
8
6.0兆
75.1
转运体
HRNet-S-W32
4
64
128
1个
8.0兆
76.1
【文件预览】:
TransPose-main
----.gitignore(2KB)
----requirements.txt(124B)
----experiments()
--------coco()
----LICENSE(1KB)
----tools()
--------jit_handles.py(9KB)
--------_init_paths.py(739B)
--------compute_flops.py(3KB)
--------test.py(5KB)
--------flop_count.py(6KB)
--------train.py(7KB)
----README.md(8KB)
----transpose_architecture.png(463KB)
----lib()
--------core()
--------Makefile(116B)
--------dataset()
--------nms()
--------models()
--------utils()
--------config()
----attention_map_image_dependency_transposeh_thres_0.0.jpg(568KB)
----hubconf.py(5KB)
----attention_map_image_dependency_transposer_thres_0.0.jpg(467KB)
----attention_map_image_dependency_transposeh_thres_0.00075.jpg(461KB)
----attention_map_image_dependency_transposer_thres_0.01.jpg(391KB)