文件名称:legacy-text-classification:text-classification - 使用流行的 ML 库(如 scikit-learn)来简化文本分类任务的 python 包
文件大小:6.99MB
文件格式:ZIP
更新时间:2024-07-19 02:40:49
Python
文本分类 text-classification 是一个 Python 包,它使用流行的 ML 库(例如 scikit-learn)来简化文本分类任务 任务分为3个主要模块: tester - 对数据的最佳分类器和参数集执行网格搜索,或对保存的分类器和参数运行测试 学习器 - 在给定分类器和参数集的数据上训练模型 预测器 - 使用保存的模型来预测输入文本的类别 一步一步如何: 安装 首先 - 因为这个包使用 scikit-learn 你应该先安装它,并阅读文档: : 在您了解此包工具如何处理分类问题后,您可以继续使用“文本分类”。 将 zip 或“git clone ”下载到一个空文件夹。 在根文件夹(“text-classification-master”)中打开命令行窗口并输入:“python setup.py install” 该软件包将安装到您的 python 软件
【文件预览】:
legacy-text-classification-master
----.gitignore(502B)
----README.rst(8KB)
----dist()
--------text_classification-0.1-py2.7.egg(4.92MB)
----text_classification()
--------saved_models.py(6KB)
--------command_line.py(137B)
--------predictor.py(6KB)
--------predictor.bat(136B)
--------learner.bat(331B)
--------models.py(4KB)
--------tests()
--------tester1.bat(94B)
--------logger.py(223B)
--------classifiers.py(2KB)
--------tester3.bat(95B)
--------gridsearch.py(524B)
--------settings.py(161B)
--------utils.py(227B)
--------tester.bat(66B)
--------normalizer.py(3KB)
--------__init__.py(0B)
--------.idea()
--------tester2.bat(94B)
--------pickler.py(955B)
--------learner.py(4KB)
--------data.py(2KB)
--------tester.py(3KB)
--------data()
--------lib()
--------pipeline.py(4KB)
--------language_detector.py(4KB)
----build()
--------lib()
----.idea()
--------workspace.xml(55KB)
--------encodings.xml(166B)
--------vcs.xml(166B)
--------dictionaries()
--------misc.xml(218B)
--------modules.xml(292B)
--------scopes()
--------.name(19B)
--------text-classification.iml(286B)
----MANIFEST.in(157B)
----setup.py(853B)