文件名称:punny_captions:NAACL 2018文件“ Punny Captions”的实施
文件大小:48KB
文件格式:ZIP
更新时间:2024-05-30 04:44:47
natural-language-processing computer-vision image-captioning mscoco-image-dataset im2txt
旁遮普语字幕:图片说明中的机智文字游戏 这是由Arjun Chandrasekaran,Devi Parikh和Mohit Bansal撰写的NAACL '18论文“有趣的字幕:图像描述中的机智文字游戏”的实现。 RNN的前向实现已完成。 对于预训练模型“展示和讲述”已经从使用,在im2txt原纸实施文件一起从。 主要对im2txt/caption_generator和im2txt/run_inference文件进行了更改。 从开始使用了用于提取由Inception-ResNet-v2模型预测的前5个对象类别的代码。 文件inception_resnet_v2.py已添加到im2txt文件夹。 全文请访问: : 实施细节:对纸的修改 本文使用了Inception-ResNet-v2模型中的前5个对象类别。 我们观察到许多这些对象类别包含多个单词。 例如, meat_loaf或Cho
【文件预览】:
punny_captions-master
----im2txt()
--------ops()
--------train.py(4KB)
--------configuration.py(4KB)
--------show_and_tell_model.py(13KB)
--------inference_utils()
--------run_inference.py(6KB)
--------inception_resnet_v2.py(16KB)
--------inference_wrapper.py(2KB)
--------show_and_tell_model_test.py(7KB)
--------data()
--------evaluate.py(7KB)
--------BUILD(2KB)
----README.md(5KB)