文件名称:sense2vec::duck:上下文相关词向量
文件大小:53KB
文件格式:ZIP
更新时间:2024-02-23 22:59:59
python nlp machine-learning natural-language-processing word2vec
sense2vec:上下文相关词向量 sense2vec( ,2015)是对一个很好的改进,可让您学习更多有趣且详细的单词向量。 该库是用于加载,查询和训练sense2vec模型的简单Python实现。 有关更多详细信息,请查看。 要探索2015年和2019年所有Reddit评论中的语义相似性,请参阅。 :duck: 1.0版发布了! :sparkles: 产品特点 基于词性标签和实体标签的多词短语查询向量。 spaCy管道组件和扩展属性。 完全可序列化,因此您可以轻松地将您的sense2vec向量与spaCy模型包一起运送。 可选缓存最近邻居的超快“最相似”查询。 培训采用预训练spaCy模型,原始文本和自己的载体或Word2Vec通过 ()。 注释配方,用于评估模型,创建相似的多单词短语列表并将其转换为匹配模式,例如基于规则的NER或引导NER注释()。 :rocket: 快速开始 独立使用 from sense2vec import Sense2Vec s2v = Sense2Vec (). from_disk ( "/path/to/s2v_reddit_2
【文件预览】:
sense2vec-master
----MANIFEST.in(34B)
----sense2vec()
--------util.py(7KB)
--------prodigy_recipes.py(27KB)
--------sense2vec.py(14KB)
--------__init__.py(374B)
--------component.py(9KB)
----scripts()
--------04_glove_train_vectors.py(2KB)
--------requirements.txt(54B)
--------05_export.py(5KB)
--------streamlit_sense2vec.py(3KB)
--------04_fasttext_train_vectors.py(6KB)
--------06_precompute_cache.py(5KB)
--------01_parse.py(2KB)
--------02_preprocess.py(2KB)
--------03_glove_build_counts.py(3KB)
----requirements.txt(217B)
----LICENSE(1KB)
----setup.cfg(2KB)
----setup.py(153B)
----README.md(51KB)
----azure-pipelines.yml(1001B)
----tests()
--------test_util.py(2KB)
--------test_component.py(3KB)
--------test_model.py(2KB)
--------__init__.py(0B)
--------test_sense2vec.py(6KB)
--------data()
----.gitignore(891B)
----bin()
--------push-tag.sh(259B)