Quadflor:Python中的End-2-End多标签分类

时间:2024-05-23 09:01:27
【文件属性】:

文件名称:Quadflor:Python中的End-2-End多标签分类

文件大小:3.95MB

文件格式:ZIP

更新时间:2024-05-23 09:01:27

machine-learning thesaurus labels neural-networks multi-label-classification

四花 多标签分类 多标签分类任务包括将一组类标签分配给主题样本。 在科学或新闻文件的上下文中,该任务等效于主题索引。 使用机器学习,目标是从一组带标签的文档训练到未带标签的文档进行概括。 文本分类管道 是用于文档多标签分类及其评估的文本处理管道。 给定具有描述符标签的特定领域词库,不同的算法将学习如何将这些标签分配给训练集中的文档。 该框架支持进行概念提取,同义词集解析,扩展激活(包括分层重新加权)的机会。 这些功能的进一步处理由分类器执行。 作为内置的分类器选项,Quadflor提供: 朴素贝叶斯(两个变体) 逻辑回归 线性支持向量机 K最近邻居(两个多标签改编变体以及Rocchio), 随机梯度下降 堆叠式决策树分类器 Learning2Rank 多层感知器(MLP) 尽管文本处理管道旨在自动评估新型分类策略,但也可以在实际环境中使用所有已知文档作为​​训练数据并对新的未知文


网友评论