imbalanced_data

时间:2021-04-21 05:30:54
【文件属性】:
文件名称:imbalanced_data
文件大小:6KB
文件格式:ZIP
更新时间:2021-04-21 05:30:54
Python 不平衡数据 数据集描述: 该数据集包含2013年以来的信用卡交易记录。出于隐私方面的考虑,已使用主成分分析(PCA)转换了实际功能。 因此,几乎所有功能都没有内在含义。 尚未通过PCA转换的唯一功能是“时间”和“金额”。 功能“时间”包含数据集中每个事务和第一个事务之间经过的秒数。 功能“金额”就是交易。 特征“类”是目标变量。 如果发生欺诈,“类别”的值为1,否则为0。 训练集: : 测试集: : 评估指标: 对于所有实验,请使用以下评估指标: 接收器工作特性曲线下的面积(AUC分数)( ) 最终测试集的性能也将使用AUC分数进行评估。 指示: Q1)使用5倍交叉验证,实现一个非常幼稚的基线分类器,在该基线分类器中为每个样本预测多数类别(无欺诈)。 在表格中报告AUC评分的平均值和标准偏差。 Q2)使用5倍交叉验证,执行超参数和模型选择。 评估以下每个模型: 随机森林
【文件预览】:
imbalanced_data-main
----credit_card_fraud.py(31KB)
----README.md(3KB)

网友评论