smote的matlab代码-dsc-class-imbalance-problems:dsc-class-imbalance-problem

时间:2024-07-09 00:56:55
【文件属性】:

文件名称:smote的matlab代码-dsc-class-imbalance-problems:dsc-class-imbalance-problem

文件大小:1.35MB

文件格式:ZIP

更新时间:2024-07-09 00:56:55

系统开源

smote的matlab代码阶级不平衡问题 介绍 您已经了解了作为评估分类器性能的指标的精度、召回率、准确率、f1 分数、ROC 曲线和 AUC。 有了这个,您已经看到衡量分类算法的性能与回归的性能有何显着不同。 例如,我们简要讨论了一个场景,其中 1000 个案例中只有 2 个被标记为“阳性”。 在这种极端情况下,即使是一个简单地总是预测“负面”标签的简单分类器,其准确率也会达到 99.8%。 此外,此类场景在医疗条件或信用卡欺诈等领域较为常见。 这被称为“类别不平衡”问题。 因此,关于类不平衡问题和调整分类算法以更好地适应这些场景的方法,已经有很多工作和研究。 目标 你将能够: 描述为什么类别不平衡会导致机器学习问题 列出解决类不平衡问题的不同方法 班级权重 处理类不平衡问题的一种初始选择是对两个类进行加权。 默认情况下,scikit-learn 中逻辑回归的类权重为None ,这意味着两个类在调整模型时将具有同等重要性。 或者,您可以传递'balanced'以分配与该类的频率成反比的权重。 最后一个选项是使用{'class_label': weight}形式的字典显式地将权重传递


【文件预览】:
dsc-class-imbalance-problems-master
----index_files()
--------index_11_1.png(41KB)
--------index_16_1.png(39KB)
----images()
--------roc_regularization.png(105KB)
----index.ipynb(130KB)
----.gitignore(64B)
----.learn(87B)
----README.md(19KB)
----mobile_app_attribution.csv(3.89MB)

网友评论

相关文章