文件名称:dmn-plus:Pytorch教程,用于实现动态内存网络增强版
文件大小:239KB
文件格式:ZIP
更新时间:2024-06-03 09:03:17
nlp deep-learning memory-network dynamic-memory-network pytorch-implmention
动态内存网络增强版 这是论文的Pytorch实现。 本文是原始论文《的改进版本。 这些想法之间的主要区别在于输入模块和内存模块的功能,此存储库的IPython笔记本文件中对此进行了详细说明。 描述 DMN +的整个体系结构由4个模块组成:输入模块,存储模块,问题模块和答案模块。 输入模块使用位置编码器和BidirectionalGRU以比DMN更好的方式对输入文本表示进行编码。 内存模块使用基于Attention的GRU来计算表示与先前内存状态和问题相关的输入的子向量,最后使用它来更新其下一内存状态。 问题模块使用一个简单的GRU对问题进行编码以获取其向量表示形式。 答案模块根据最终的记忆状态和问题来预测答案。 CrossEntropyLoss已用于网络和Adam优化器中,以优化模型参数。 该模型已在bAbI数据集上训练,该数据集包含20个不同的问答任务。 要求 Python
【文件预览】:
dmn-plus-master
----inputModule.png(112KB)
----train_test.py(6KB)
----dmn_loader.py(5KB)
----README.md(2KB)
----modelDMN.py(10KB)
----DMNPlus.ipynb(187KB)
----fetch_data.sh(228B)