一. 流形学习的英文名为manifold learning。其主要思想是把一个高维的数据非线性映射到低维,该低维数据能够反映高维数据的本质,当然有一个前提假设就是高维观察数据存在流形结构,其优点是非参数,非线性,求解过程简单。
二. 流形学习的可行性是因为:1.从认知心理学的角度来讲心理学家认为人的认知过程是基于认知流形和拓扑连续性的;2.许多高维采用数据都是由少数几个隐变量所决定的,所以可以用少数的低维数据来刻画高维数据。
三. 流形学习所需的数学背景知识:微分流形,黎曼流形,微分几何,切向量场,拓扑空间,光滑映射等。
四. 经典流形学习算法:
Isomap:等距映射。前提假设为低维空间中的欧式距离等于高维空间中的侧地线距离,当然该算法具体实施时是高维空间中较近点之间的测地线距离用欧式距离代替,较远点距离用测地线距离用最短路径逼近。
LLE:局部线性嵌入。前提假设是数据所在的低维流形在局部是线性的,且每个采样点均可以利用其近邻样本进行线性重构表示。
LE:拉普拉斯特征映射。前提假设是在高维中很近的点投影到低维空间中的象也应该离得很近。
HLLE:局部等距映射。前提假设是如果一个流形局部等距与欧式空间中的一个开集,那么由这个流形到开集的映射函数为一个线性函数,线性函数的二次混合偏导数为0,所以由hessian系数构成的二次型也为0.
LPP:局部保留投影。在LE算法的基础上,假设一个从原空间到流形空间的映射矩阵P,然后通过某种方法求出P,最后得到了一个显示的投影映射。
LTSA:局部坐标表示。其基本思想是流形的局部几何先用切坐标表示,那么流形中的每一个点处的切空间可以和欧式空间中的一个开子集建立同构,也就是切映射。
MVU:局部等距。构造一个局部的稀疏欧式距离矩阵,同构保持距离来学习一个核矩阵。
Logmap:侧地距离和方向。思想是已知流形空间中一点的坐标和方向,通过切平面找到法坐标,形成一个指数映射。
……
五.流形学习存在的问题:
抗干扰噪声能力差,低维空间的维数不好确定,需要存在流形结构这一假设,采样需要稠密采样,测试数据的out-of-samples问题。
六.流形学习未来的发展方向:
提高鲁棒性,可视化手段提高,低维空间维数的确定,与统计学习结合等。
七.参考文献:
1.中科院计算所ppt,《流形学习专题》。
2.中科院自动化所计算机视觉课件ppt,《流形学习》。
3.雷迎科 (2011). 流形学习算法及其应用研究, 中国科学技术大学.
4.网上的疯狂转帖(没真实作者来源),通俗易懂。也放一个转帖:http://blog.csdn.net/zhulingchen/archive/2008/02/26/2123129.aspx.
5. 徐蓉, 姜峰, et al. (2006). "流形学习概述." 智能系统学报 1(1): 44-51.
作者:tornadomeet 出处:http://www.cnblogs.com/tornadomeet 欢迎转载或分享,但请务必声明文章出处。 (新浪微博:tornadomeet,欢迎交流!)