文件名称:bankloan.sav 该假设数据文件涉及某银行在降低贷款拖欠率方面的举措。
文件大小:52KB
文件格式:SAV
更新时间:2022-05-01 09:32:18
R spss
bankloan.sav 该假设数据文件涉及某银行在降低贷款拖欠率方面的举措。该文件包含 850 位过去和潜在客户的财务和人口统计信息。前 700 个个案是以前曾获得贷款的客户。剩下的 150 个个案是潜在客户,银行需要按高或低信用风险对他们进行分类。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;