文件名称:中英文语料训练CBOW模型获得词向量(pytorch实现)
文件大小:13.58MB
文件格式:ZIP
更新时间:2021-11-14 21:18:25
nlp pytorch cbow 词向量
自然语言处理第二次作业: data文件夹中存储语料(中文语料以及英文语料由老师提供,另一份为中文停用词语料) output文件夹中存储输出的词向量文件 script文件夹中为CBOW的脚本,同时处理中文语料与英文语料 运行步骤:在脚本中确定训练中文或者是英语后,直接运行即可
【文件预览】:
.idea
----misc.xml(198B)
----workspace.xml(9KB)
----word2vec.iml(495B)
----inspectionProfiles()
--------profiles_settings.xml(174B)
----modules.xml(275B)
----.gitignore(50B)
word2vec
----output()
--------en_wordvec.txt(14.8MB)
--------zh_wordvec.txt(15.69MB)
----script()
--------CBOW_ENandZH.py(9KB)
----data()
--------zh.txt(846KB)
--------stopwords.txt(5KB)
--------en.txt(1.04MB)