0.1 机器学习分类
监督学习(Supervised Learning)训练数据包含了类别信息,典型问题为分类(classification)和回归(regression),典型算法有logistic regression, BP神经网络算法和线性回归算法
无监督学习,典型问题为聚类(clustering),代表算法为K-Means/DBSCAN
半监督学习,训练数据有一部分包含类别信息,有一部分不包含
0.2监督学习
分类:label为离散值
回归:label为连续值
0.3无监督学习
由于没有数据标签,在学习时并不知道其分类结果是否正确
聚类算法只是分类,并不关心类别具体是什么
在无监督学习中,还有降维算法,基本原理是将样本点从输入空间通过线性或者非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示
0.4推荐系统和深度学习
推荐系统(recommendation system, RS)的出现被称为连接用户与信息的桥梁,一方面帮助用户从海量数据中找到感兴趣的信息,另一方面将有价值的信息传递给潜在用户
推荐算法有协同过滤算法,基于矩阵分解的推荐算法和基于图的推荐算法
深度学习可以逐层训练,传统的机器学习算法利用浅层结构,一般包含一到两层非线性特征变换,浅层结构在处理复杂的和自然信号的问题时,会遇到很多问题
常用的深度学习模型:自编码器模型,通过堆叠自编码器构建深层网络; 卷积神经网络模型,通过卷积层与采样层的不断交替构建深层网络;循环神经网络