多语种:多语言文本(NLP)处理工具包

时间:2024-03-18 02:38:17
【文件属性】:

文件名称:多语种:多语言文本(NLP)处理工具包

文件大小:184KB

文件格式:ZIP

更新时间:2024-03-18 02:38:17

Python

多种语言 Polyglot是支持大量多语言应用程序的自然语言管道。 免费软件:GPLv3许可证 文档: : 。 特征 标记化(165种语言) 语言检测(196种语言) 命名实体识别(40种语言) 语音标记的一部分(16种语言) 情感分析(136种语言) 词嵌入(137种语言) 形态分析(135种语言) 音译(69种语言) 开发者 Rami Al-Rfou @ rmyeid gmail com 快速教程 import polyglot from polyglot . text import Text , Word 语言检测 text = Text ( "Bonjour, Mesdames." ) print ( "Language Detected: Code={}, Name={} \n " . format ( text . language . code , te


【文件预览】:
polyglot-master
----MANIFEST.in(215B)
----README.rst(15B)
----CONTRIBUTING.rst(3KB)
----notebooks()
--------testdata()
--------Installation.ipynb(3KB)
--------Dev.ipynb(21KB)
--------CLI.ipynb(11KB)
--------Download.ipynb(21KB)
--------Transliteration.ipynb(9KB)
--------NamedEntityRecognition.ipynb(9KB)
--------POS.ipynb(8KB)
--------TODO.ipynb(2KB)
--------MorphologicalAnalysis.ipynb(12KB)
--------Detection.ipynb(19KB)
--------Tokenization.ipynb(9KB)
--------Sentiment.ipynb(10KB)
--------Embeddings.ipynb(26KB)
--------README.ipynb(9KB)
----.vimrc(78B)
----rtd_requirements.txt(142B)
----HISTORY.rst(856B)
----requirements.txt(95B)
----AUTHORS.rst(165B)
----.travis.yml(411B)
----tox.ini(182B)
----LICENSE(35KB)
----setup.cfg(21B)
----setup.py(4KB)
----Makefile(1KB)
----nb2rst.sh(236B)
----polyglot()
--------load.py(4KB)
--------text.py(18KB)
--------transliteration()
--------base.py(6KB)
--------decorators.py(814B)
--------utils.py(2KB)
--------tag()
--------__init__.py(700B)
--------tokenize()
--------__main__.py(10KB)
--------downloader.py(49KB)
--------detect()
--------mixins.py(7KB)
--------mapping()
--------tests()
----docs()
--------authors.rst(27B)
--------README.rst(5KB)
--------make.bat(6KB)
--------MorphologicalAnalysis.rst(9KB)
--------Dev.rst(16KB)
--------contributing.rst(32B)
--------conf.py(11KB)
--------Sentiment.rst(7KB)
--------usage.rst(73B)
--------polyglot.rst(1KB)
--------Download.rst(17KB)
--------Embeddings_files()
--------CLI.rst(7KB)
--------polyglot.tokenize.rst(427B)
--------history.rst(27B)
--------Tokenization.rst(5KB)
--------sphinxext()
--------Detection.rst(13KB)
--------TODO.rst(993B)
--------index_latex.rst(496B)
--------polyglot.detect.rst(508B)
--------polyglot.tag.rst(392B)
--------POS.rst(5KB)
--------index.rst(557B)
--------Makefile(7KB)
--------Transliteration.rst(6KB)
--------Installation.rst(1KB)
--------Embeddings.rst(6KB)
--------polyglot.transliteration.rst(476B)
--------modules.rst(61B)
--------NamedEntityRecognition.rst(6KB)
--------polyglot.mapping.rst(763B)
----tests()
--------__init__.py(23B)
--------test_polyglot.py(387B)
----.gitignore(423B)

网友评论