文件名称:ruTS:从俄语文本中提取统计数据的库
文件大小:2.92MB
文件格式:ZIP
更新时间:2024-08-24 23:14:39
nlp natural-language-processing russian-specific computational-linguistics text-analytics
俄语文本统计 (ruTS) 从俄语文本中提取统计数据的库。 安装 跑步: $ pip install ruts 依赖项: Python 3.7+ nltk pymorphy2 拉兹德尔 scipy 空间 麻木的 熊猫 matplotlib 图形可视化 功能性 主要功能基于适用于俄语的库的统计数据,并允许您直接处理文本和spaCy库的准备好的 Doc 对象。 检索对象 该库允许您创建自己的工具来从文本中提取句子和单词,然后可用于计算统计数据。 例子: import re from nltk . corpus import stopwords from ruts import SentsExtractor , WordsExtractor text = "Не имей 100 рублей, а имей 100 друзей" se = SentsExtracto
【文件预览】:
ruTS-master
----LICENSE.txt(1KB)
----poetry.lock(115KB)
----README.en.md(17KB)
----.travis.yml(734B)
----mkdocs.yml(3KB)
----README.md(21KB)
----Makefile(2KB)
----.pre-commit-config.yaml(1KB)
----docs()
--------index.md(5KB)
--------components.md(5KB)
--------img()
--------js()
--------datasets()
--------css()
--------extractors()
--------authors.md(2KB)
--------stats()
--------installation.md(2KB)
--------visualizers()
----tests()
--------test_extractors.py(5KB)
--------test_morph_stats.py(4KB)
--------test_basic_stats.py(4KB)
--------test_readability_stats.py(2KB)
--------__init__.py(0B)
--------datasets()
--------test_utils.py(2KB)
--------test_diversity_stats.py(4KB)
--------test_components.py(2KB)
--------visualizers()
----.gitignore(124B)
----ruts()
--------diversity_stats.py(20KB)
--------basic_stats.py(8KB)
--------readability_stats.py(13KB)
--------utils.py(5KB)
--------morph_stats.py(9KB)
--------__init__.py(1KB)
--------datasets()
--------components.py(5KB)
--------extractors.py(10KB)
--------visualizers()
--------constants.py(6KB)
----pyproject.toml(3KB)