semi-supervised-svm:数据科学作业。 半监督分类算法

时间:2021-05-09 14:04:14
【文件属性】:
文件名称:semi-supervised-svm:数据科学作业。 半监督分类算法
文件大小:2KB
文件格式:ZIP
更新时间:2021-05-09 14:04:14
Python 半监督的svm 数据科学分配解决方案。 使用支持向量机作为基础分类器的半监督分类器的实现。 该数据集是在代码中随机生成的。 依存关系: 麻木 斯克莱恩 分类问题 给定数据: 大量未标记的数据 少量标注数据 能够正确标记未标记数据集中任何样本的人类专家,其费用与新标记样本的数量成正比 目标: 降低成本 提高分类器的准确性 解决方案 该解决方案将具有最高置信度的预测标签添加到标签数据集中。 置信度最低的标签表明分类器需要人工专家的帮助。 这些真实的标签将添加到数据集中,并且成本会增加。 人类专家的提示数量不能超过标记样本的初始数量-标记数据的数量只能加倍。 如果准确性为100%,成本达到先前说明的限制或没有将任何样本添加到标记的数据集中,则算法终止。 例子 设置: 数据集:10000个样本,3个类,每个类2个类,3个信息性特征。 最大限度。 迭代次数:100 数据集中未标记数据的
【文件预览】:
semi-supervised-svm-master
----TrainClassifier.py(3KB)
----README.md(2KB)

网友评论