今天学到的是无监督学习(Unsupervised Learning)。
所谓无监督学习,就是给出一个数据集,这个数据集不在有类似一个特征对应一个答案的结果,而是通过聚类(Cluster)算法将这一个数据集分成几个部分,每个部分都有各自的特征,但是没有具体定义特征是什么,只定义了他们是不同的。类似上一节的肿瘤问题:
这次只是分成了两个聚类而已。
在举一个例子:鸡尾酒会问题。当有许多个人同时说话时,要具体将每个人的话分析独立出来时,就将用到聚类算法。
今天的内容比较简单,概念也少,就写到这里。