面向不平衡问题的集成特征选择 (2011年)

时间:2024-05-30 01:18:14
【文件属性】:

文件名称:面向不平衡问题的集成特征选择 (2011年)

文件大小:484KB

文件格式:PDF

更新时间:2024-05-30 01:18:14

工程技术 论文

传统的特征选择方法基本上是以精度为优化目标,没有充分考虑数据样本类别分布倾斜性,在数据分布不平衡的数据集上性能表现不理想。在不平衡数据集上通过有放回的抽样方法独立地从数据集大类样本集中随机抽取多个样本子集,使每次随机抽取的样本数量与小类样本数量一致,然后将各抽取的样本子集分别与小类样本集组合成多个新的训练样本集。对多个新样本集的特征子集以集成学习的方式采用投票机制进行投票,数据集的最终特征子集以得票数目超过半数的特征共同组合而成。在UCI不平衡数据集上的实验结果显示,提出的方法表现出了较好的性能,是一种能


网友评论