TRUNAJOD2.0:一个易于使用的库,可从文本中提取索引

时间:2021-04-16 23:00:28
【文件属性】:
文件名称:TRUNAJOD2.0:一个易于使用的库,可从文本中提取索引
文件大小:22.57MB
文件格式:ZIP
更新时间:2021-04-16 23:00:28
natural-language-processing text-mining text-analysis spacy text-processing TRUNAJOD:基于spaCy的文本复杂性库,用于文本分析 TRUNAJOD是在高性能库的基础上进行文本复杂性分析的Python库。 利用spaCy提供的所有基本NLP功能(依赖关系分析,POS标记,标记化), TRUNAJOD专注于从文本中提取度量,这对于不同的应用程序和用例可能是有趣的。 尽管大多数索引可以针对不同的语言进行计算,但目前我们主要支持西班牙语。 如果您为您的语言实现的索引做出贡献,我们将非常高兴! 特征 文本处理的实用程序,例如lemmatization,POS检查。 来自文本的语义度量,例如句子之间的平均连贯性和平均同义词重叠。 诸如字母代词密度和代词名词比率之类的测量度。 内置的情感词典可根据文本中的单词来计算情感计算。 词汇语义规范数据集,用于从文本中计算词汇语义变量。 输入基于令牌比率(TTR)的指标,以及可调TTR指标。 内置音节器(当前仅用于西
【文件预览】:
TRUNAJOD2.0-master
----MANIFEST.in(33B)
----.readthedocs.yml(568B)
----models()
--------trunajod_models_v0.1.tar.gz(13.84MB)
----.coveragerc(712B)
----pyproject.toml(382B)
----.pre-commit-hooks.yaml(525B)
----docs()
--------conf.py(4KB)
--------make.bat(799B)
--------api_reference()
--------requirements.txt(44B)
--------Makefile(638B)
--------index.rst(104B)
----pytest.ini(180B)
----.github()
--------workflows()
----TRUNAJOD_MODELS()
--------wordnet_noun_synsets.pickle(4.63MB)
--------wordnet_verb_synsets.pickle(546KB)
--------spanish_lexicosemantic_norms.pickle(125KB)
--------stopwords-es.txt(5KB)
--------lemmatizador.pickle(18.48MB)
----tests()
--------ttr_test.py(3KB)
--------test_syllabizer.py(942B)
--------semantic_measures_test.py(1KB)
--------lexico_semantic_norms_test.py(3KB)
--------discourse_markers_test.py(2KB)
--------givenness_test.py(711B)
--------utils_test.py(1KB)
--------surface_proxies_test.py(1KB)
--------emotions_test.py(2KB)
----tox.ini(191B)
----LICENSE(1KB)
----imgs()
--------figure1.png(95KB)
--------trunajod_logo.png(76KB)
--------figure2.png(83KB)
--------trunajod_thumb.png(11KB)
----CONTRIBUTING.md(5KB)
----src()
--------TRUNAJOD()
----paper.md(8KB)
----paper.bib(4KB)
----setup.py(2KB)
----.gitignore(2KB)
----tester.py(2KB)
----stanza_example.py(1KB)
----CHANGELOG.md(243B)
----README.md(11KB)
----.flake8(92B)
----requirements-test.txt(65B)
----.pre-commit-config.yaml(585B)

网友评论