文件名称:生成对抗神经网络matlab代码-NeuralTalk:NeuralTalk
文件大小:5.07MB
文件格式:ZIP
更新时间:2024-06-22 07:24:11
系统开源
生成对抗神经网络matlab代码#NeuralTalk 警告:已弃用。 您好,这段代码现在很旧且效率低下,现在已弃用。 我将它留在 Github 上用于教育目的,但如果您想运行或训练图像字幕,我强烈推荐我的新代码版本。 NeuralTalk2 是用编写的,并且明显(我的意思是,~100 倍以上)更快,因为它是在 GPU 上进行批处理和运行的。 它还支持 CNN 微调,这对性能有很大帮助。 该项目包含Python+numpy源代码,用于学习用句子描述图像的多模态循环神经网络。 这方面的工作最近出现在 a 中,并且在过去几个月里一直是研究界多篇学术论文的主题。 此代码目前实现了 和 提出的模型。 两种模型都采用图像并使用循环神经网络(LSTM 或 RNN)预测其句子描述。 概述 该项目的管道如下所示: 输入是使用 Amazon Mechanical Turk 收集的图像数据集和 5 个句子描述。 特别是,此代码库是为 、 和 数据集设置的。 在训练阶段,图像作为输入提供给 RNN,并要求 RNN 预测句子中的单词,条件是当前单词和先前的上下文,由神经网络的隐藏层介导。 在这个阶段,网络的参