fairseq-image-captioning-master

时间:2024-05-10 23:42:27
【文件属性】:

文件名称:fairseq-image-captioning-master

文件大小:1.53MB

文件格式:ZIP

更新时间:2024-05-10 23:42:27

Python

图像字幕变压器 该项目使用基于的图像字幕模型扩展了 。 它仍在进行中,并受到以下论文的启发: [1] 史蒂文·雷尼(Steven J. 。 2017年,计算机视觉与模式识别,第1179-1195页。 [2] 彼得·安德森(Peter Anderson),何小东,克里斯·布勒(Chris Buehler),达米安·泰尼(Damien Teney),马克·约翰逊(Mark Johnson),斯蒂芬·古尔德(Stephen Gould),张磊。 。 在IEEE计算机视觉和模式识别会议会议录中,第6077-6086页,2018年。 [3] Ashish Vaswani,Noam Shazeer,Niki Parmar,Jakob Uszkoreit,Llion Jones,Aidan N.Gomez,ŁukaszKaiser和Illia Polosukhin。 。 《神经信息处理系统的


【文件预览】:
fairseq-image-captioning-master-master
----preprocess()
--------preprocess_captions.sh(2KB)
--------tokenize_captions_scst.py(2KB)
--------tokenize_captions.py(3KB)
--------preprocess_images.py(2KB)
--------preprocess_features.py(3KB)
----score.sh(80B)
----preprocess_captions.sh(302B)
----preprocess_images.sh(170B)
----.gitmodules(129B)
----score.py(1KB)
----data.py(10KB)
----generate.py(5KB)
----model()
--------caption.py(7KB)
--------modules.py(869B)
--------inception.py(3KB)
----task.py(4KB)
----demo()
--------demo-ids.txt(42B)
--------demo-predictions.json(435B)
----scst()
--------criterion.py(4KB)
--------generator.py(5KB)
----LICENSE(11KB)
----environment.yml(342B)
----README.md(15KB)
----docs()
--------features.jpg(25KB)
--------baseline.jpg(274KB)
--------predictions.png(412KB)
----preprocess_features.sh(157B)
----splits()
--------karpathy_valid_images.txt(219KB)
--------karpathy_train_images.txt(5.16MB)
--------karpathy_test_images.txt(219KB)
----.gitignore(5B)
----viewer.ipynb(3KB)

网友评论