word-embeddings-benchmarks:用于评估词嵌入的包

时间:2024-06-19 03:36:57
【文件属性】:

文件名称:word-embeddings-benchmarks:用于评估词嵌入的包

文件大小:60KB

文件格式:ZIP

更新时间:2024-06-19 03:36:57

Python

词嵌入基准 Word Embedding Benchmark (web) 包专注于提供易于评估和报告常见基准(类比、相似性和分类)结果的方法。 该软件包的研究目标是通过易于访问的可重复结果(因为目前文献中有很多相互矛盾的结果)来帮助推动词嵌入研究。 这也应该有助于回答我们是否应该设计新方法来评估词嵌入的问题。 要在所有快速运行的基准测试中评估您的嵌入(转换为 word2vec 或 python dict pickle),请执行./scripts/eval_on_all.py 。 请查看包中可用嵌入的结果。 警告和免责声明: 类比测试不会在内部对单词嵌入进行规范化。 软件包目前正在开发中,我们预计在未来几个月内将正式发布. 目前可能困扰您的主要问题是嵌入加载时间相当长(特别是如果您使用提取器)。 另请参阅我们最近关于评估方法的出版物 。 特征:


【文件预览】:
word-embeddings-benchmarks-master
----setup.py(3KB)
----.gitignore(760B)
----requirements.txt(133B)
----CHANGES.rst(0B)
----.travis.yml(398B)
----LICENSE(1KB)
----examples()
--------solve_analogy.ipynb(4KB)
--------evaluate_similarity.ipynb(3KB)
--------solve_analogy.py(931B)
--------evaluate_similarity.py(1KB)
----scripts()
--------evaluate_embeddings.py(2KB)
--------word2vec_wikipedia()
--------evaluate_on_all.py(3KB)
----web()
--------embedding.py(19KB)
--------vocabulary.py(7KB)
--------datasets()
--------__init__.py(0B)
--------_utils()
--------utils.py(3KB)
--------tests()
--------evaluate.py(14KB)
--------version.py(135B)
--------analogy.py(4KB)
--------embeddings.py(19KB)
----README.rst(3KB)

网友评论