文件名称:Alteryx预测默认风险的分类模型
文件大小:1.91MB
文件格式:ZIP
更新时间:2024-03-07 08:10:17
Alteryx预测默认风险的分类模型 信誉度 步骤1:了解业务和数据 需要做出什么决定? 主要目标是预测该人值得获得信贷,根据他的历史记录,鉴于其个人特征/变量,所涉及的风险是多少。 需要哪些数据来告知这些决定? 需要历史数据(包括他的年龄/状态/以前的记录等)来预测可能的最佳结果,无论他/她是否退还贷款。 我们需要使用哪种模型(连续,二进制,非二进制,时间序列)来帮助做出这些决策? 由于我们试图预测一个人是否值得,因此它明确指出了一个二元问题,因此我们需要为此使用二元模型。 步骤2:建立训练集 对于数字数据字段,相关性至少应为0.70,才能被视为“高”。 缺少大量数据的字段应删除。 您的数据字段的子集中只有几个值吗? 数据字段看起来是否非常统一(整个字段只有一个值?)。 这称为“低可变性”,您应该删除具有低可变性的字段。 请参阅“提示”部分,以查找低变异性数据字段的示例。 您
【文件预览】:
Classification-Models-for-Predicting-Default-Risk-in-Alteryx-master
----images()
--------all_GB_var-imp.PNG(53KB)
--------selective_var_gainChart.PNG(64KB)
--------1.PNG(51KB)
--------Variables.PNG(81KB)
--------4.PNG(41KB)
--------GB_var-imp.PNG(46KB)
--------LR_p-values.PNG(80KB)
--------Accuracy_all.PNG(56KB)
--------Accuracy_Selective_Variables.PNG(57KB)
--------Variables2.PNG(76KB)
--------all_var_gainChart.PNG(63KB)
--------RF_var-imp.PNG(54KB)
--------selective_confusion_matrix.PNG(121KB)
--------selective_ROC.PNG(61KB)
--------all_confusion_matrix.PNG(116KB)
--------3.PNG(40KB)
--------2.PNG(39KB)
--------all_LR_p-values.PNG(142KB)
--------all_DT_var-imp.PNG(55KB)
--------data.PNG(44KB)
--------all_RF_var-imp.PNG(54KB)
--------DT_var-imp.PNG(46KB)
--------Alteryx workflow.PNG(243KB)
--------workflow.PNG(243KB)
--------all_ROC.PNG(60KB)
----Alteryx()
--------project-template.yxmd(70KB)
----README.md(6KB)
----Data()
--------customers-to-score.xlsx(47KB)
--------credit-data-training.xlsx(46KB)