文件名称:Credit_Risk_Analysis
文件大小:14KB
文件格式:ZIP
更新时间:2024-04-25 05:03:51
JupyterNotebook
Credit_Risk_Analysis 分析概述: 该分析的目的是使用不同的重采样技术来预测信用风险,以评估来自点对点借贷服务公司LendingClub的信用卡数据集,并在进行预测后对模型进行评估,以查看是否应将其用于预测风险。 由于信用风险是天生的不平衡分类问题,因为优质贷款容易超过风险贷款,因此测试不同的评估数据方法非常重要。 对于此分析,我使用RandomOverSample和SMOTE算法对数据进行过采样,然后使用ClusterCentroid算法对数据进行过采样,最后使用SMOTEEN算法对数据进行过采样和欠采样的组合方法。 我比较了两种可减少偏差的新机器学习模型BalancedRandomForestClassifier和EasyEnsembleClassifier,以预测信用风险。 结果: * RandomOverSample 平衡的准确性得分为---,而准确性和召回得
【文件预览】:
Credit_Risk_Analysis-main
----credit_risk_ensemble.ipynb(39KB)
----credit_risk_resampling.ipynb(40KB)
----README.md(2KB)