文件名称:Image-Caption-IR--Im2txt
文件大小:2.94MB
文件格式:ZIP
更新时间:2024-05-20 18:42:15
Python
重要的提示 受Oriol Vinyals,Alexander Toshev,Samy Bengio,Dumitru Erhan所做工作的启发。 用于图像字幕的Show and Tell模型的一种基本且简化的版本(即用型参考)。 跑步 下载,并将其放置在model/train 根据您的TF版本修复代码。 (推荐版本1.2) python fix_ckpoints.py 这将生成所需的checkpoint文件,指向TF检查点文件。 修复python代码。 请参阅 在图像上运行推断: ./inference.sh 根据需要修改路径 内容 型号概述 介绍 Show and Tell模型是一个深层的神经网络,它学习如何描述图像的内容。 例如: 建筑学 Show and Tell模型是编码器-解码器神经网络的一个示例。 它的工作原理是先将图像“编码”为固定长度的矢量表示形式,然后将其“解码
【文件预览】:
Image-Caption-IR--Im2txt-master
----data()
--------mscoco()
--------input_imgs()
----fix_ckpoints.py(950B)
----LICENSE(1KB)
----README.md(6KB)
----WORKSPACE(27B)
----im2txt()
--------inference_wrapper.py(1KB)
--------data()
--------show_and_tell_model.py(13KB)
--------ops()
--------BUILD(2KB)
--------show_and_tell_model_test.py(6KB)
--------evaluate.py(6KB)
--------inference_utils()
--------configuration.py(3KB)
--------run_inference.py(2KB)
--------train.py(3KB)
----g3doc()
--------show_and_tell_architecture.png(880KB)
--------COCO_val2014_000000224477.jpg(190KB)
--------example_captions.jpg(421KB)
----inference.sh(1KB)