文件名称:spacy-ru:SpaCy的俄语模型
文件大小:25.82MB
文件格式:ZIP
更新时间:2024-06-17 05:26:44
JupyterNotebook
spaCy库的俄语模型 有spacy 2.3的模型: 它们的用法如下: wget https://github.com/buriy/spacy-ru/releases/download/v2.3_beta/ru2_combined_400ks_96.zip unzip ru2_combined_400ks_96.zip 之后: import spacy nlp = spacy.load('ru2_combined_400ks_96') 这是2.1版的文档。 此ru2模型在2.1版中的优点 ru2模型不仅可以在x.pos_中定义POS标签,而且可以在x.lemma_中定义词lemma。 例如,对于名词,引理与名词性单数相同。 由于spacy库的设备的特殊性,为了获得更好质量的引理,您需要编写 import ru2 nlp = ru2.load_ru2('ru2') 代替标准 i
【文件预览】:
spacy-ru-master
----ru2e()
--------tokenizer.py(467B)
--------examples.py(5KB)
--------meta.json(225B)
--------lemmatizer.py(8KB)
--------__init__.py(774B)
--------syntax_iterators.py(2KB)
--------tokenizer(24KB)
----utils()
--------pluck.py(352B)
--------corpus.py(4KB)
--------__init__.py(0B)
--------tqdm.py(643B)
----notebooks()
--------examples()
--------corpora()
--------training()
----tokenize-ru.sh(51B)
----Dockerfile(572B)
----examples()
--------POS_and_syntax.ipynb(39KB)
--------classifier.py(5KB)
--------__init__.py(0B)
--------tokenize()
--------full_simple_example.py(1KB)
--------sentences.py(257B)
----tokenize-xx.sh(51B)
----LICENSE(1KB)
----setup.py(215B)
----README.md(7KB)
----Makefile(1KB)
----ru2()
--------vocab()
--------examples.py(5KB)
--------tagger()
--------meta.json(309B)
--------training.log(3KB)
--------lemmatizer.py(8KB)
--------__init__.py(628B)
--------parser()
--------syntax_iterators.py(2KB)
--------ner()
--------tokenizer(24KB)
----.gitignore(172B)
----pyproject.toml(594B)