【文件属性】:
文件名称:semi-supervised-svm:数据科学作业。 半监督分类算法
文件大小:2KB
文件格式:ZIP
更新时间:2021-05-09 14:04:14
Python
半监督的svm
数据科学分配解决方案。 使用支持向量机作为基础分类器的半监督分类器的实现。 该数据集是在代码中随机生成的。
依存关系:
麻木
斯克莱恩
分类问题
给定数据:
大量未标记的数据
少量标注数据
能够正确标记未标记数据集中任何样本的人类专家,其费用与新标记样本的数量成正比
目标:
降低成本
提高分类器的准确性
解决方案
该解决方案将具有最高置信度的预测标签添加到标签数据集中。 置信度最低的标签表明分类器需要人工专家的帮助。 这些真实的标签将添加到数据集中,并且成本会增加。 人类专家的提示数量不能超过标记样本的初始数量-标记数据的数量只能加倍。 如果准确性为100%,成本达到先前说明的限制或没有将任何样本添加到标记的数据集中,则算法终止。
例子
设置:
数据集:10000个样本,3个类,每个类2个类,3个信息性特征。
最大限度。 迭代次数:100
数据集中未标记数据的
【文件预览】:
semi-supervised-svm-master
----TrainClassifier.py(3KB)
----README.md(2KB)