文件名称:thesis:理学硕士项目
文件大小:2.89MB
文件格式:ZIP
更新时间:2024-05-22 10:23:43
Python
理学硕士论文:从句子嵌入推断句子特征 抽象的 本文研究了递归神经网络(RNN)对哪些句子特征进行编码。 我们训练了两个最先进的RNN句子编码器,并将它们与CBOW(连续词袋)基线进行比较,该基线通过平均预先训练的词向量来表示句子。 我们在以下三个任务上评估模型:预测(i)句子长度(ii)单词内容,以及(iii)依赖项标签。 我们的发现是,在与完整句子或单词顺序有关的信息不重要的任务上(例如,单词内容任务),CBOW基线与RNN编码器的性能相当。 而在有关单词全义或顺序信息很重要的任务上(例如,句子长度和依存标记任务),RNN的性能优于CBOW基线。 本文的主要贡献是表明可以从只能访问句子嵌入和两个词嵌入的分类器中检索依赖项标签。 这提供了一些证据,表明RNN能够学习单词之间的句法关系,即使这不是他们所训练的目标的一部分。 在进一步检查句子嵌入时,我们还说明某些维度包含有关句子特定方面的信息
【文件预览】:
thesis-master
----.gitignore(174B)
----infersent()
--------__init__.py(0B)
--------LICENSE(19KB)
--------infersent.py(17KB)
--------data.py(5KB)
----Inferring_Sentence_Features_from_Sentence_Embeddings.pdf(3.4MB)
----__init__.py(53B)
----forget()
--------forget_words.py(12KB)
--------get_common.py(3KB)
--------forget_words2.py(16KB)
--------forget.py(9KB)
----README.md(1KB)
----evaluate.py(8KB)
----tasks()
--------__init__.py(0B)
--------predict_sent.py(10KB)
--------predict_words.py(12KB)
--------predict_dep.py(14KB)
--------predict_length.py(10KB)
--------README.md(8B)
--------visualize.py(21KB)
--------conll_process.py(822B)
--------predict_order.py(6KB)
----skipthought()
--------gru_cell.py(15KB)
--------__init__.py(0B)
--------skipthought.py(24KB)
--------vocab_expansion.py(5KB)
--------README.md(2KB)
--------util.py(7KB)
--------autoencoder.py(15KB)
--------shuffle.py(3KB)
----encoder.py(6KB)