SIF_reproduce:此回购包含代码和结果,用于在论文中重现结果

时间:2024-05-21 13:47:44
【文件属性】:

文件名称:SIF_reproduce:此回购包含代码和结果,用于在论文中重现结果

文件大小:1.46MB

文件格式:ZIP

更新时间:2024-05-21 13:47:44

sentence2vec sif word-embedding Python

我的SIF工具 此repo包含代码和结果,用于重现论文中的结果:句子嵌入的简单但又艰难的基线 作为一种简单的方法,它可以用作文档相似性匹配的基准; 句子嵌入(向​​量句); 特征表示; 和其他任务。 由于它非常容易且快速,因此建议在使用复杂的神经网络方法之前对其进行测试。 论文链接: 作者的代码: 要求 建议使用virtual env 。 pip install -r requirements.txt 我的环境: python == 3.6 spacy == 2.0.11 numpy == 1.14.0 scipy == 1.0.0 sklearn == 0.19.1 算法 SIF 输入:单词嵌入$$ v_w $$,一组句子$$ S $$,参数$$ a $$,单词的估计概率$$ p(w)$$ 输出:句子嵌入$$ v_s $$ 在$$ S $$中的所有句子$$ s $$做 $


【文件预览】:
SIF_reproduce-master
----example.py(2KB)
----data()
--------sts2015()
--------sts2014()
----resources()
--------enwiki_vocab_min200.txt(2.29MB)
----LICENSE(1KB)
----SIF()
--------utils.py(2KB)
--------__init__.py(44B)
--------embedding.py(2KB)
----requirements.txt(28B)
----.gitignore(1KB)
----README.md(5KB)

网友评论