文件名称:Fast_Sentence_Embeddings:快速计算句子嵌入!
文件大小:482KB
文件格式:ZIP
更新时间:2024-05-20 10:40:39
cython embeddings gensim fse fasttext
快速句子嵌入(fse) 快速句子嵌入是一个Python库,可作为Gensim的补充。 该库旨在为句子或文档的大量集合计算句子向量。 免责声明:我目前正在全职工作。 不幸的是,我还没有时间添加我想看到的所有功能。 特别是API需要进行大修,我们需要对gensim 4.0.0的支持。 如果您想支持 ,请进行快速调查以改进它:-) 特征 在此处找到相应的博客文章: fse实现了三种用于句子嵌入的算法。 您可以在未加权的句子平均值,平滑的逆频率平均值和无监督的平滑逆频率平均值之间进行选择。 fse的主要功能是: [X]最高500.000句/秒(1) [X]支持平均,SIF和uSIF嵌入 [X]全面支持Gensims Word2Vec和所有其他兼容的类 [X]全面支持Gensims FastText,但不带词汇 [X]预训练嵌入的词频归纳 [X]令人难以置信的快速Cython核心例程 [
【文件预览】:
Fast_Sentence_Embeddings-master
----MANIFEST.in(161B)
----.travis.yml(516B)
----LICENSE(34KB)
----.lgtm.yml(365B)
----setup.py(5KB)
----.gitignore(753B)
----README.md(8KB)
----notebooks()
--------Speed Comparision.ipynb(8KB)
--------STS-Benchmarks.ipynb(39KB)
--------Tutorial.ipynb(29KB)
----fse()
--------eval()
--------models()
--------test()
--------inputs.py(12KB)
--------__init__.py(559B)
----.gitattributes(66B)