home-credit-default-risk:抵押贷款违约的分析和预测模型

时间:2024-04-16 02:56:15
【文件属性】:

文件名称:home-credit-default-risk:抵押贷款违约的分析和预测模型

文件大小:99.99MB

文件格式:ZIP

更新时间:2024-04-16 02:56:15

JupyterNotebook

贷款违约风险分析:执行摘要 问题陈述 对房屋信贷的违约风险数据集的分析将集中在生成准确的贷款违约风险概率上。 预测贷款违约对于银行的盈利能力至关重要,鉴于贷款市场的竞争性质,收集正确数据的银行可以提供和服务更多的贷款。 数据集的目标变量是二进制标签“ TARGET”,指示贷款是否进入默认状态。 数据源 https://www.kaggle.com/c/home-credit-default-risk/overview 给定目标变量的二进制性质,分析任务就是分类。 最终模型将生成每笔贷款的违约概率,并且将在“收款人操作特征”曲线下的区域内评估预测的违约概率与贷款是否违约之间的预测概率。 我们认为,良好的预测模型能够实现70%至80%的准确性。 数据理解 1.探索性分析:数据的含义 该数据集包含307,511笔个人贷款。 出于此任务的目的,分析将仅限于初始训练和测试集,另外还要增加三个从Bu


【文件预览】:
home-credit-default-risk-master
----.gitignore(2KB)
----html()
--------tree_importances_autoencoder_embeddings.html(126KB)
--------MiniLab2_CRISP-DM.html(1.54MB)
--------rf_tuning.html(58KB)
--------mean_tree_importances_autoencoder_embeddings.html(39KB)
--------profiling_report.html(3.4MB)
--------feature_importance.html(54KB)
--------vif_features.html(10KB)
--------feature_descriptions.html(18KB)
--------Lab_2_data.html(6.35MB)
--------MiniLab1 CRISP-DM .html(1.43MB)
----_data()
--------HomeCredit_columns_description.csv(37KB)
--------RFclassifier_Grid_Search.csv(2KB)
----home-credit-default-risk.zip(70.09MB)
----notebooks()
--------Cluster_Tuning.ipynb(3.75MB)
--------myTreeName.dot(118KB)
--------Lab2_testing.ipynb(507KB)
--------MiniLab1_CRISP-DM.ipynb(1.14MB)
--------tree.dot(4KB)
--------diabetes.png(2.41MB)
--------loans.png(732KB)
--------MiniLab2_CRISP-DM.ipynb(1.13MB)
--------Lab3_CRISP-DM.ipynb(3.01MB)
--------Lab3_CRISP-DM.html(3.42MB)
--------MiniLab_Logistic_Regression_and_SVM-DM.ipynb(663KB)
--------dtree.dot(0B)
--------association_rule_mining.ipynb(1.92MB)
--------Clustering_stuart.ipynb(9.08MB)
--------project_code()
--------Feature_Selection.ipynb(190KB)
--------Autoencoding.ipynb(1.99MB)
----_images()
--------clf_perfom_boxplot.png(9KB)
--------crisps-dm-minilab.png(73KB)
--------crisps-dm.png(130KB)
--------clf_rocs.png(57KB)
--------TreeImportances.png(30KB)
--------home_credit_DB_structure.png(65KB)
--------MachineLearning-Lab3_System.png(73KB)
--------Clustering_System.png(34KB)
--------clf_times.png(14KB)
--------batchdeployment_process.png(39KB)
--------crisps-dm3.png(92KB)
--------income_amount.png(246KB)
----README.md(2KB)
----_pickles()
--------autoencoder_embeddings(2.35MB)
--------autoencoder_rf_predictions(235KB)
--------README.md(631B)
--------autoencoder_embeddings_downsampled(625KB)
--------sorted_important_features(12KB)
--------autoencoder_embeddings_downsampled_agglom(235KB)
--------autoencoder_rf_best_params(277B)
----.gitattributes(75B)

网友评论