文件名称:Grassmann多峰隐式特征选择
文件大小:1.18MB
文件格式:PDF
更新时间:2024-06-17 15:02:25
Multimodal features; Feature selection; The
在模式识别领域,对象通常由多个特征(多峰特征)表示。 例如,要表征自然场景图像,必须提取一组表示其颜色,纹理和形状信息的视觉特征。 但是,集成多峰特征以进行识别具有挑战性,因为:(1)每个特征都有其特定的统计属性和物理解释,(2)大量特征可能会导致维数的诅咒(当数据维数很高时,成对之间的距离由于中心极限理论的原因,特征空间中的物体变得越来越相似(这种现象对识别性能产生负面影响),并且(3)某些特征可能不可用。 为了解决这些问题,提出了一种新的多峰特征选择算法,称为格拉斯曼流形特征选择(GMFS)。 特别是,通过定义聚类标准,将多峰特征转换为矩阵,并进一步视为Hamm和Lee(Grassmann判别分析:基于子空间的学习的统一观点)上的Grassmann流形上的一个点。第25届国际机器学习会议(ICML),第376-383页,芬兰赫尔辛基[2008]。 为了处理不可用的特征,计算了L2-Hausdorff距离,即不同大小的矩阵之间的度量,并相应地获得了内核。 基于内核,我们提出了监督/非监督特征选择算法,以实现多模式特征的物理意义上的嵌入。 在八个数据集上的实验结果验证了该方法的有效性。