文件名称:catr:使用Transformer的图像字幕
文件大小:3.01MB
文件格式:ZIP
更新时间:2024-05-24 23:52:42
transformer image-captioning Python
CA⫶TR :带有变压器的图像字幕 针对CATR的PyTorch培训代码和预训练模型( CA ption TR ansformer)。 也可以通过割炬轮毂使用这些模型,以简单地加载具有预训练砝码的模型: model = torch . hub . load ( 'saahiluppal/catr' , 'v3' , pretrained = True ) # you can choose between v1, v2 and v3 样品: 所有这些图像均已由CATR注释。 使用您自己的图像进行测试: $ python predict.py --path /path/to/image --v v2 // You can choose between v1, v2, v3 [default is v3] 或在colab中试用 用法 CATR中没有多余的已编译组件,并且程序包依赖
【文件预览】:
catr-master
----engine.py(2KB)
----.github()
--------airplane.png(470KB)
--------horse.png(569KB)
--------office.png(507KB)
--------cake.png(581KB)
--------cruise.png(504KB)
--------girl.png(425KB)
----models()
--------backbone.py(4KB)
--------caption.py(2KB)
--------utils.py(2KB)
--------__init__.py(0B)
--------position_encoding.py(3KB)
--------transformer.py(13KB)
----hubconf.py(1KB)
----configuration.py(1KB)
----main.py(3KB)
----requirements.txt(41B)
----predict.py(2KB)
----datasets()
--------utils.py(2KB)
--------coco.py(4KB)
--------__init__.py(0B)
----finetune.py(3KB)
----LICENSE(11KB)
----README.md(2KB)
----.gitignore(2KB)
----catr_demo.ipynb(25KB)