文件名称:基于信息的来源评估和选择的质量
文件大小:511KB
文件格式:PDF
更新时间:2024-04-08 22:37:22
Multiple information sources; Neighborhood mutual
同一对象集的多个信息源可以提供不同的表示形式,将它们的优点结合起来可以提高给定任务的预测能力。但是,值得注意的是,某些来源可能无关紧要或多余。因此,选择一组可以帮助改善学习成绩的良好信息资源是有意义的,而关于该主题的报道很少。在本文中,我们首先确定信息质量的两个方面,即源重要性和源冗余。具体而言,重要性表示信息源对分类的贡献程度,冗余则表示不同信息源之间的信息重叠。然后,我们提出了一种度量标准,该度量标准将邻域互惠信息与最大显着性-最小冗余算法相结合,使我们能够选择一组紧凑的高级信息源进行分类学习。大量的实验表明,该度量标准对于查找良好的信息源非常有帮助,并且所提出的方法优于许多其他方法。