文件名称:img2txt:用于图像字幕的端到端深度学习模型
文件大小:1.44MB
文件格式:ZIP
更新时间:2024-06-08 02:38:34
deep-learning tensorflow show-and-tell captioning-images Python
img2txt 端到端深度学习模型,用于生成句子中图像内容的摘要。 概述 要快速浏览,请参阅。 致谢 该模型架构基于 “展示和讲述:从2015年MSCOCO图片字幕挑战赛中学到的经验。” Oriol Vinyals,Alexander Toshev,Samy Bengio,Dumitru Erhan。 IEEE关于模式分析和机器智能的交易(2016)。 TensorFlow模型Zoo中的以下代码经常被用作参考, 但是代码是使用TensorFlow API从头开始编写的,但Inception模型的代码是从的当前主版本(325609e)中获得的。 要求 图书馆 img2txt是在以下环境下开发的。 Ubuntu 16.04.2 LTS Python 3.6 NumPy TensorFlow 1.2 枕头 NLTK( nltk_data/tokenizers/punkt/PY3
【文件预览】:
img2txt-master
----word_embedding_plot.py(13KB)
----img2txt_api_example.ipynb(9KB)
----web_ui.py(6KB)
----ms_coco_word_embedding_pca_cosine.npy(180KB)
----templates()
--------config.html(2KB)
--------result.html(2KB)
--------index.html(121B)
--------layout.html(691B)
----inception()
--------inception_v4.py(15KB)
--------inception_utils.py(3KB)
--------inception_v3.py(27KB)
----dataset.py(11KB)
----convnet.py(8KB)
----gru_ms_coco_config.json(778B)
----static()
--------favicon-96x96.png(4KB)
--------favicon-32x32.png(1KB)
--------favicon-16x16.png(1KB)
--------favicon.ico(1KB)
----ms_coco_vocabulary.json(754KB)
----flickr_8k_vocabulary.json(222KB)
----web_ui_screenshot.png(916KB)
----model.py(51KB)
----web_app.wsgi(1KB)
----README.md(3KB)
----default_config.json(998B)