文件名称:代表性区域选择的数据探索:公理和收敛-研究论文
文件大小:546KB
文件格式:PDF
更新时间:2024-06-29 22:33:36
Representative Region Selection
我们提出了一种新型的无监督学习问题,在该问题中,我们找到了一小组近似于更大数据集的代表性区域。 这些区域可以与附加信息一起呈现给从业者,以帮助从业者探索数据集。 这种方法的一个优点是它不依赖于数据的集群结构。 我们正式定义了这个问题,并提出了衡量代表质量的函数应该满足的公理。 我们提供满足所有这些公理的质量函数。 使用这个质量函数,我们制定了两个寻找代表的优化问题。 我们提供了一类通用方法的收敛结果,并表明这些结果适用于几种特定方法,包括从本文中制定的优化问题的解决方案中导出的方法。 我们提供了一个示例,说明如何使用代表性区域来探索数据集。