无监督和有监督算法的区别
转载声明
本文大量内容系转载自以下文章,有删改,并参考其他文档资料加入了一些内容:
- 无监督和有监督算法的区别
- 作者:keepreder
- 出处:****
转载仅为方便学习查看,一切权利属于原作者,本人只是做了整理和排版,如果带来不便请联系我删除。
0x01 有监督学习
有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。
这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。
0x02 无监督学习
无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。
这里,所有的标记(分类)是未知的。因此,训练样本的岐义性高。
聚类就是典型的无监督学习。
0x03 区别
无监督和有监督的理解方法有很多,主要可以从以下几方面来理解:
-
无监督与监督学习的区别在于一个无教学值,一个有教学值。但是,个人认为他们的区别在于无监督学习一般是采用聚簇等算法来分类不同样本。而监督学习一般是利用教学值与实际输出值产生的误差,进行误差反向传播修改权值来完成网络修正的。但是无监督学习没有反向传播修改权值操作。
-
样本全部带标记/样本全部不带标记··· PS:部分带标记的是半监督学习
-
训练集有输入有输出是有监督,包括所有的回归算法分类算法,比如线性回归、决策树、神经网络、
KNN
、SVM
等; -
训练集只有输入没有输出是无监督,包括所有的聚类算法,比如
k-means
、PCA
、GMM
等