文件名称:Competition_notebook:数据竞赛笔记fork
文件大小:18KB
文件格式:ZIP
更新时间:2024-04-21 04:05:14
目录 比赛 结构化比赛 2019年厦门国际银行数创金融杯 赛题链接赛题任务信用风险是金融监管机构重点关注的风险,关乎金融系统运行的稳定。在实际业务开展和模型构建过程中,面临着高维稀疏特征以及样本不平衡等各种问题,如何应用机器学习等数据挖掘方法提高信用风险的评估和预测能力,是各家金融机构积极探索的方向。的实战能力。本次赛题被引用为20个非匿名的业务变量以及84个匿名分支,在极不平衡的样本数据中,预测客户是否会出现信用违约行为。赛题难点①数据的高维稀疏性导致数据的可利用性降低,给模型学习能力的提升带来了困难;②数据的极度不平衡,导致模型极其容易出现过拟合问题;③匿名区间的处理:如何理解并使用匿名分段中潜在的业务意义;④新旧数据探索:如何重新建立新旧数据的差异,如何把握特征的新旧差异,以及如何建立适当的验证策略;方案参考 安泰杯-跨境电商智能算法大赛 赛题链接赛题任务今天许多中国互联网公司都在响
【文件预览】:
Competition_notebook-master
----README.md(46KB)