vit-pytorch:在Pytorch中实现视觉变压器,这是仅使用一个变压器编码器即可在视觉分类中实现SOTA的简单方法

时间:2024-04-05 02:51:45
【文件属性】:

文件名称:vit-pytorch:在Pytorch中实现视觉变压器,这是仅使用一个变压器编码器即可在视觉分类中实现SOTA的简单方法

文件大小:5.66MB

文件格式:ZIP

更新时间:2024-04-05 02:51:45

computer-vision transformers artificial-intelligence image-classification attention-mechanism

视觉变压器-火炬 实现,这是在Pytorch中仅使用一个变压器编码器即可在视觉分类中实现SOTA的一种简单方法。 视频中进一步解释了。 此处实际上没有多少代码,但也可以为所有人进行布局,因此我们可以加快注意力的革命。 有关使用预训练模型的Pytorch实施,请查看Ross Wightman的存储库。 官方的Jax存储库在。 安装 $ pip install vit-pytorch 用法 import torch from vit_pytorch import ViT v = ViT ( image_size = 256 , patch_size = 32 , num_classes = 1000 , dim = 1024 , depth = 6 , heads = 16 , mlp_dim = 2048 , dropout


【文件预览】:
vit-pytorch-main
----vit_pytorch()
--------vit_pytorch.py(4KB)
--------t2t.py(3KB)
--------distill.py(4KB)
--------__init__.py(40B)
--------mpp.py(6KB)
--------efficient.py(2KB)
----.github()
--------workflows()
----t2t.png(109KB)
----LICENSE(1KB)
----examples()
--------cats_and_dogs.ipynb(1.06MB)
----vit.gif(5.76MB)
----setup.py(757B)
----.gitignore(2KB)
----README.md(11KB)
----distill.png(49KB)

网友评论