文件名称:土耳其语-Word2Vec:土耳其语的预训练Word2Vec模型
文件大小:5KB
文件格式:ZIP
更新时间:2024-02-24 12:22:47
nlp word2vec turkish gensim NaturallanguageprocessingPython
土耳其语预训练Word2Vec模型 (下面是土耳其语版本。/Türkçeiçinaşağıyabakın。) 本教程介绍了如何从Wikipedia转储中为土耳其语训练word2vec模型。 此代码使用库以Python 3编写。 土耳其语是一种凝集性语言,*语料库中有很多词具有相同的词缀和不同的后缀。 我将写土耳其语lemmatizer来提高模型的质量。 您可以查看以了解更多详细信息。 如果您只想下载预训练的模型,则可以使用并且可以在github Wiki中的页面中查找示例。 其中一些如下: word_vectors.most_similar(positive=["kral","ka
【文件预览】:
Turkish-Word2Vec-master
----.gitignore(104B)
----trainCorpus.py(794B)
----LICENSE(1KB)
----README.md(4KB)
----preprocess.py(2KB)