文件名称:Spherical-Text-Embedding:[NeurIPS 2019]球形文本嵌入
文件大小:10.76MB
文件格式:ZIP
更新时间:2024-03-28 06:39:58
word-embeddings unsupervised-learning spherical-geometry sentence-embeddings document-embeddings
球形文字嵌入 在NeurIPS 2019中发布的用于Spherical Text Embedding的源代码。代码结构(尤其是文件读取和保存功能)改编自。 要求 GCC编译器(用于编译源c文件):请参阅有关的。 预训练的嵌入 我们在上提供了经过预训练的JoSE嵌入。 与诸如Word2Vec和GloVe之类的欧几里德嵌入不同,球形嵌入不一定受益于高维空间,因此,首先从低维嵌入开始可能是一个好主意。 运行代码 我们提供了一个shell脚本run.sh来编译源文件和训练嵌入。 注意:在准备训练文本语料库时,请确保文件中的每一行都是一个文档/段落。 超参数 注:建议使用默认的超参数,尤其是阴性样品(数量-negative )和损失函数保证金( -margin )。 调用不带参数的命令以获得超参数及其含义的列表: $ ./src/jose Parameters: -train
【文件预览】:
Spherical-Text-Embedding-master
----.gitignore(168B)
----eval_classify.sh(1KB)
----datasets()
--------MEN()
--------SimLex-999()
--------wordsim353()
--------20news()
--------wiki()
----src()
--------jose.c(27KB)
--------makefile(271B)
----sim.py(3KB)
----eval_sim.sh(2KB)
----LICENSE.txt(11KB)
----eval_cluster.sh(1KB)
----README.md(5KB)
----run.sh(862B)
----cluster.py(4KB)
----classify.py(2KB)