preprocessor:用Python进行优雅,轻松的Tweet预处理

时间:2024-05-22 13:11:45
【文件属性】:

文件名称:preprocessor:用Python进行优雅,轻松的Tweet预处理

文件大小:39KB

文件格式:ZIP

更新时间:2024-05-22 13:11:45

Python

预处理器 预处理程序是用于处理用Python编写的推文数据的预处理库。 在基于推文和文本数据构建机器学习系统时,需要进行预处理。 由于数据质量以及降维目的,这是必需的。 该库使清理,解析或标记化推文变得容易,因此您不必一次又一次地编写相同的帮助函数。 特征 目前支持清理,标记化和解析: 网址 标签 提及 保留字(RT,FAV) 表情符号 笑脸 号码 JSON和.txt文件支持 预处理v0.6.0 Python 3.4+ on Linux, macOS and Windows支持Python 3.4+ on Linux, macOS and Windows 。 测试在以下设置上运行: Linux Xenial with Python 3.4.8, 3.5.6, 3.6.7, 3.7.1, 3.8.0, 3.8.3+ macOS with Python 3.7.5, 3.8.0 Wi


【文件预览】:
preprocessor-master
----MANIFEST.in(23B)
----requirements()
--------requirements.txt(0B)
--------dev-requirements.txt(28B)
----README.rst(5KB)
----.github()
--------ISSUE_TEMPLATE()
----preprocessor()
--------utils.py(7KB)
--------enum.py(263B)
--------__init__.py(942B)
--------defines.py(4KB)
--------parse.py(3KB)
--------preprocess.py(3KB)
--------api.py(3KB)
----.travis.yml(2KB)
----LICENSE.md(34KB)
----setup.py(1KB)
----Makefile(339B)
----docs()
--------conf.py(9KB)
--------index.rst(572B)
--------Makefile(8KB)
----tests()
--------test_clean_numbers.py(2KB)
--------artifacts()
--------test_api.py(6KB)
--------__init__.py(40B)
--------test_utils.py(6KB)
----.gitignore(931B)

网友评论