文件名称:Word-Sense-Disambiguation-using-Bidirectional-LSTM
文件大小:12.37MB
文件格式:ZIP
更新时间:2024-05-21 13:56:30
tensorflow keras python3 lstm word-sense-disambiguation
使用双向LSTM的词义消歧 文件描述: data.py:预处理Senseval2和Senseval3数据集,获取model4.py的输入,包括目标感官的感官嵌入,并转发数据并向后绕过中心词。 google_data.py:预处理Google研究数据集-Word Sense消除歧义语料库,获取model4.py的输入,包括目标意义的意义嵌入,并向前和向后绕过中心词。 model4.py:构建消除词义歧义的BSTM,使用data.py或google_data.py作为输入,它将输出模型。 globe.py:为我们自己的数据集加载经过预训练的手套字嵌入向量 sense_embedding.csv:Google的100维感知向量-Word Sense Disambiguation corpora senseval_sense_embedding.csv:Senseval2数据集的100维
【文件预览】:
Word-Sense-Disambiguation-using-Bidirectional-LSTM-master
----sense_embedding.csv(11.31MB)
----data()
--------senseval2()
--------senseval3()
----google_data.py(14KB)
----Final_report.pdf(429KB)
----senseval_sense_embedding.csv(1.08MB)
----glove.py(1KB)
----README.md(1KB)
----model4.py(6KB)
----data.py(24KB)