文件名称:Python-normalizrPython对文本进行规范化的库
文件大小:72KB
文件格式:ZIP
更新时间:2022-08-29 21:21:52
Python开发-文本解析和操作
normalizr-Python对文本进行规范化的库.现有删除多余的空格,删除连字符,删除标点符号,(来自13个不同的语言)删除停用词,删除符号功能. 下一步准备实现消除口音的功能.
【文件预览】:
davidmogar-cucco-bdbb8a2
----test-requirements.txt(52B)
----.gitignore(2KB)
----.codeclimate.yml(419B)
----README.rst(3KB)
----CHANGELOG.md(1KB)
----tests()
--------test_batch.py(5KB)
--------test_config.py(5KB)
--------test_regex.py(1KB)
--------test_cucco.py(4KB)
--------test_cases.json(9KB)
--------files()
----LICENSE(1KB)
----cucco()
--------errors.py(301B)
--------cucco.py(10KB)
--------regex.py(945B)
--------batch.py(6KB)
--------config.py(4KB)
--------logging.py(632B)
--------cli.py(3KB)
--------__init__.py(175B)
--------data()
----CODE_OF_CONDUCT.md(3KB)
----scripts()
--------after_success.sh(304B)
----requirements.txt(48B)
----MANIFEST.in(39B)
----setup.py(1KB)
----.travis.yml(340B)
----.codecov.yml(74B)