文件名称:生成对抗神经网络matlab代码-neuraltalk:神经对话
文件大小:133KB
文件格式:ZIP
更新时间:2024-06-22 07:21:56
系统开源
生成对抗神经网络matlab代码#NeuralTalk 该项目包含Python+numpy源代码,用于学习用句子描述图像的多模态循环神经网络。 这方面的工作最近出现在 a 中,并且在过去几个月里一直是研究界多篇学术论文的主题。 此代码目前实现了 和 提出的模型。 两种模型都采用图像并使用循环神经网络(LSTM 或 RNN)预测其句子描述。 概述 该项目的管道如下所示: 输入是使用 Amazon Mechanical Turk 收集的图像数据集和 5 个句子描述。 特别是,此代码库是为 、 和 数据集设置的。 在训练阶段,图像作为输入提供给 RNN,并要求 RNN 预测句子中的单词,条件是当前单词和先前的上下文,由神经网络的隐藏层介导。 在这个阶段,网络的参数通过反向传播进行训练。 在预测阶段,一组保留的图像被传递给 RNN,RNN 一次一个词地生成句子。 结果通过BLEU 分数和排名实验(即将推出)进行评估。 该代码还包括用于在 HTML 中可视化结果的实用程序。 依赖关系 Python 2.7 ,现代版本的numpy/scipy , nltk (如果你想做 BLEU 分数评估), a
【文件预览】:
neuraltalk-master
----eval_sentence_predictions.py(5KB)
----monitorcv.html(4KB)
----.gitignore(13B)
----imagernn()
--------lstm_generator.py(11KB)
--------imagernn_utils.py(2KB)
--------Readme.md(841B)
--------rnn_generator.py(9KB)
--------utils.py(804B)
--------solver.py(5KB)
--------__init__.py(0B)
--------generic_batch_generator.py(6KB)
--------data_provider.py(4KB)
----driver.py(15KB)
----cv()
--------Readme.md(39B)
----Readme.md(6KB)
----vis_resources()
--------jquery-1.8.3.min.js(91KB)
--------underscore-min.js(14KB)
--------d3utils.js(1KB)
--------d3utils.css(277B)
--------underscore-min.map(25KB)
--------d3.min.js(143KB)
--------jsutils.js(809B)
----visualize_result_struct.html(5KB)
----status()
--------Readme.md(57B)
----data()
--------README.md(92B)
----matlab_features_reference()
--------prepare_images_batch.m(635B)
--------README.md(756B)
--------extract_features.m(1KB)
--------deploy_features.prototxt(4KB)