高教社杯全国大学生数学建模竞赛赛题 C题分析与思路!(持续更新)

时间:2024-03-26 11:20:41

2020年高教社杯全国大学生数学建模竞赛赛题 C题分析与思路!(持续更新)

C题 中小微企业的信贷决策

**1、**C题题目背景+分析
在实际中,由于中小微企业规模相对较小,也缺少抵押资产,因此银行通常是依据信贷政策、企业的交易票据信息和上下游企业的影响力,向实力强、供求关系稳定的企业提供贷款,并可以对信誉高、信贷风险小的企业给予利率优惠。银行首先根据中小微企业的实力、信誉对其信贷风险做出评估,然后依据信贷风险等因素来确定是否放贷及贷款额度、利率和期限等信贷策略。

背景分析:首先题目说明银行目前是根据信贷政策、企业的交易票据信息和上下游企业的影响力评估企业的,判断出怎样的企业是强、供求关系稳定的企业。银行会对其中好的企业给予利率优惠。

然后,题目说明了银行具体的评估方式:第一步是,对实力和信誉做出评估,评估结束后,根据评估结果,进行第二步。第二步是,根据一些因素来确定一些策略(之后应该要建立其中的一些模型)放贷及贷款额度、利率和期限等信贷策略。

某银行对确定要放贷企业的贷款额度为10-100万元;年利率为4%15%;贷款期限为1年。附件13分别给出了123家有信贷记录企业的相关数据、302家无信贷记录企业的相关数据和贷款利率与客户流失率关系的2019年统计数据。该银行请你们团队根据实际和附件中的数据信息,通过建立数学模型研究对中小微企业的信贷策略,主要解决下列问题:

背景分析:问题的条件为:贷款额度为10-100万元;年利率为4%~15%;贷款期限为1年。题目设定好了之后,千万不要改变上述的所有条件,不然可能会导致与正确结论之间存在很大出入。
**2、**附件(数据集)分析:
附件一sheet1(企业信息)提供了123家有信贷记录企业的相关数据。一共有四个指标,分别为:企业代号、企业名称、信誉评级、是否违约。其中企业代号为id,企业的唯一标识符;企业名称中附有所属的领域,可能需要在后面提取一下,然后做做相同或相似行业间的聚类分析(此处为猜测);信誉评级为abcd四个等级,为离散型数据,可以做聚类分析或者问题可能会需要做预测。我的建议是可以将离散型数据进行量化(比如a100,b80,c60,d40或其他方式做数据映射,方便后期利用一些算法做预测);是否违约为离散型数据,后面可能需要关注评级与违约之间的一种关系,做相关分析之类的。

Sheet2(进项发票信息)提供了企业代号、发票号码 开票日期、销方单位代号、金额、税额、价税合计、发票状态。具体就不一一展开说了,在后面的思路中用到再说,注意这里的所有数据根据评级是可以和附件三对应以下的。且每一个id的数量、比例等等,或许也可以添加到最后的模型当中,而且有效发票那一列,应该是在数据预处理时用的,应该剔除掉有作废发票的那些记录。(另外,如果一个企业多次出现作废发票,是否可以降低一些这个企业的信誉度,这个大家可以思考一下)负数发票应该是在计算时需要减去的部分(看看是否有与之对应的有效发票)在这里需要具体对题目中说的进项和销项做说明:

【进项发票:进项票是指增值税中列进项额的发票。购买方。

销项发票:销项指销售货物或劳务给客户,我们需要开给客户的发票。

其实增值税发票不分“销项发票”和“进项发票”的。所谓销项,无非是一般纳税人销售时开出的发票,而所谓进项,则是一般纳税人购进货物收取的发票. 当月,该纳税人要缴纳的税金等于销项减去进项,意即:只对“增值”部分纳税。

举例:

购进一件服装,价格100元,税金17元,这17元即为进项税。销售这件服装,价200元,税金34元,这34元为销项税。

假设本月你只销售这一件服装,那么应纳税=34-17=17元。】

Sheet3(销项发票记录)类同sheet2。

附件二为302家无信贷记录企业的相关数据。这里sheet1只有id和企业名称,应该是需要根据后面的sheet2和3来进行预测。这里也许可以利用一下企业名中的行业信息,将其作为一个指标进行预测。比如附件一给出的,哪些行业的信誉度更高一些,这可能是需要在后期做的,可以加分的东西。Sheet2和3类同前面附件1sheet2的分析。

这里可以明显看出需要利用一些机器学习算法做预测,需要大家最好会用python或者matlab,最好用python,因为python有很多集成好的机器学习库以及数据可视化库,大家可以直接调用,非常简单。

附件三为贷款利率与客户流失率关系的2019年统计数据,除了用于做预测之外,大家或许可以关注一下附件三内部的变化关系。比如随着信誉评级的下降,客户流失率呈现出了怎样的规律,能否量化。相同的信誉评级下,客户流失率又是怎样根据贷款年利率发生变化的。这些东西可能会对解题有所帮助。

**3、**问题分析

(1) 对附件1中123家企业的信贷风险进行量化分析,给出该银行在年度信贷总额固定时对这些企业的信贷策略。分析:问题一首先要求,此题目必须是根据数据集做量化分析(也就是做数据处理,所有的东西依托的都是数据,最后的模型结果也必须得是数值型数据才行)。此问的条件是年度信贷总额固定,求出信贷策略。此时的题目可以理解为:根据附件1中的sheet1,2,3与附件3,去建立信贷风险模型,风险低于某一阈值说明可以进行贷款。这样就可以判断出是否可以贷款给此企业。这里提供三方面的建议:数据处理方面:sheet1中的评级进行量化(数据映射),是否违约映射为0,1(二分类)当作要预测的目标,计算出企业进项总金额、企业销项总金额、企业总税额、企业进项数、企业销项数(注意,如果是作废发票或者负数发票,需要做相应的处理,见前文)、下面这些是可以加入模型的,但大家可以自己想想有哪些需要加入:月均进项(销项)金额(税额、总金额、总税额)、最高月(也算是旺季)进项(销项)金额(税额、总金额、总税额)。

模型建立方面和数据可视化方面,及后续思路,大家关注我,后续会及时更新哦。

(2) 在问题1的基础上,对附件2中302家企业的信贷风险进行量化分析,并给出该银行在年度信贷总额为1亿元时对这些企业的信贷策略。

(3) 企业的生产经营和经济效益可能会受到一些突发因素影响,而且突发因素往往对不同行业、不同类别的企业会有不同的影响。综合考虑附件2中各企业的信贷风险和可能的突发因素(例如:新冠病毒疫情)对各企业的影响,给出该银行在年度信贷总额为1亿元时的信贷调整策略。最后注意:上文的所有数据,大家应该关注到数据的预处理,有哪些数据是需要进行标准化之类的,必须要关注哦。

附:
附件中数据说明:

(1) 进项发票:企业进货(购买产品)时销售方为其开具的发票。

(2) 销项发票:企业销售产品时为购货方开具的发票。

(3) 有效发票:为正常的交易活动开具的发票。

(4) 作废发票:在为交易活动开具发票后,因故取消了该项交易,使发票作废。

(5) 负数发票:在为交易活动开具发票后,企业已入账记税,之后购方因故发生退货并退款,此时,需开具的负数发票。

(6) 信誉评级:银行内部根据企业的实际情况人工评定的,银行对信誉评级为D的企业原则上不予放贷。

(7) 客户流失率:因为贷款利率等因素银行失去潜在客户的比率。