sister:简单的感觉嵌入

时间:2024-05-21 19:22:29
【文件属性】:

文件名称:sister:简单的感觉嵌入

文件大小:38KB

文件格式:ZIP

更新时间:2024-05-21 19:22:29

python machine-learning natural-language-processing word-embeddings transformer

姐姐 SISTER(SI mple小号烯ŤENCEëmbedde R) 安装 pip install sister 基本用法 import sister sentence_embedding = sister . MeanEmbedding ( lang = "en" ) sentence = "I am a dog." vector = sentence_embedding ( sentence ) 支持的语言。 英语 日本人 法语 为了支持新的语言,请实现Tokenizer (继承sister.tokenizers.Tokenizer ),并将fastText预训练的url添加到word_embedders.get_fasttext() ()。 支持en,fr,ja(2020-06-29)的Bert模型。 实际上,Albert代表英语,CamemBERT代表法语,BERT代表日语。


【文件预览】:
sister-master
----setup.py(1KB)
----poetry.lock(79KB)
----.gitignore(49B)
----poetry.toml(32B)
----pyproject.toml(633B)
----.travis.yml(975B)
----.github()
--------ISSUE_TEMPLATE()
--------workflows()
----README.md(1KB)
----tests()
--------__init__.py(0B)
--------test_core.py(2KB)
--------test_download.py(4KB)
--------test_embedders.py(2KB)
--------test_tokenizers.py(1KB)
----sister()
--------tokenizers.py(754B)
--------__init__.py(92B)
--------download.py(3KB)
--------core.py(3KB)
--------word_embedders.py(3KB)
----.flake8(31B)
----tox.ini(166B)

网友评论