文件名称:dualbalance:双重平衡
文件大小:3.21MB
文件格式:ZIP
更新时间:2024-04-07 10:52:09
machine-learning ensemble ensemble-learning class-imbalance ensemble-model
双重平衡 “ DubalBalance:通过类间和类内平衡实现鲁棒的不平衡多类分类” (提交给ACM SIGKDD 2021) DupleBalance是用于不平衡的多类分类的整体学习框架。它是解决多类不平衡学习问题的易于使用的解决方案,具有良好的性能,计算效率以及与不同学习模型的广泛兼容性。 目录 背景 从偏斜的数据集学习分类器,即类不平衡学习,是数据挖掘中一个重要且常见的问题。不幸的是,现有方法经常遭受性能不令人满意,计算成本高或缺乏适应性的困扰。他们忽略了需要同时考虑的两种不平衡:来自不同类别的示例之间的数量差异,以及同一类别中的简单示例与困难示例之间的数量差异。为此,我们提出了DupleBalance ,这是一种新颖的集成+动态采样方法,它同时考虑了类间和类内的不平衡。具体而言, DupleBalance通过逐步平衡的混合采样(即,对多数类别进行欠采样,对少数类别进行过度采样)
【文件预览】:
dualbalance-main
----.gitignore(2KB)
----plot.py(3KB)
----requirements.txt(99B)
----base.py(3KB)
----LICENSE(1KB)
----duplebalance-example.ipynb(1.04MB)
----utils.py(3KB)
----README.md(11KB)
----figures()
--------framework.png(422KB)
--------dataset_SMOTE_RSB.png(244KB)
--------results.png(148KB)
--------dataset_ANS.png(259KB)
--------dataset_SMOTE_Tomek.png(257KB)
--------dataset_MDO.png(268KB)
--------dataset.png(233KB)
--------dataset_OUPS.png(268KB)
--------dataset_SMOTE.png(255KB)
--------dataset_Gazzah.png(242KB)
----duplebalance.py(22KB)