文件名称:Image-captioning
文件大小:12.98MB
文件格式:ZIP
更新时间:2024-04-08 03:35:35
JupyterNotebook
图像字幕 描述 图像字幕是Encoder-Decoder体系结构中最流行的应用之一,其中RNN被用作Decoder时,CNN提取并编码图像的特征。 数据 该项目的数据集是Flickr_8k数据集。它包含8000张图像,以及每个图像包含5个标题的文本文件。 模型训练 该项目中使用的库是Tensorflow,NLTK,pandas和numpy。为了对特征图像进行编码,将Inception_V3模型与转移学习一起使用以下载权重。解码器具有双向LSTM,后跟一个LSTM层。该项目采用的方法是合并模型,其中,编码器分别从图像中提取特征,而RNN分别在字幕上进行训练,然后将这些信息连接起来并通过全连接层以进行最终预测。 部署 该应用程序使用Streamlit框架创建前端API,并部署在Heroku上。 Streamlit是一个框架,您可以使用它来创建美观的前端Webapp,而无需HTML和CSS。您可
【文件预览】:
Image-captioning-main
----Model_training.ipynb(422KB)
----model_30.h5(14.72MB)
----Procfile(72B)
----app-streamlit.py(4KB)
----requirements.txt(160B)
----model_30.json(6KB)
----README.md(2KB)
----setup.sh(216B)