1、前言
随着互联网和金融科技的高速发展,风险控制已成为互联网金融机构不可或缺的一环。数据分析和风险评估是风险控制的核心,而数据则是其基石。在大数据时代,数据量大、类型繁多、数据更新快,这推动了统一资信平台的建设与发展。其中银行业务也深受驱动和变革,例如,公开的舆情信息结合机器学习技术可以帮助银行进行信贷客户的自动监控,因此银行建设资信平台来对接此类外部数据商的数据服务和自动监控服务。
通常的,银行的大多数业务系统对接资信数据服务是有同质化的服务需求,但不同的场景会需要差异化的资信数据服务内容,例如:部分场景需要不同的数据源,部分场景需要相同的数据源。
过去在业务数据量比较小的情况下,是以具体场景具体定制化开发为主,随着业务的发展这种方式会出现局部冗余且难以快速接入新场景新业务。因此银行一般会在接入数据源的基础上构建整合的变量库,辅以配置功能,主要的目的就是既能提供同质化的资信数据查询服务,又能实现差异化的场景快速实现;
对于银行存在的跨业务条线、跨职能部门的资信数据割裂问题,构统一的数据平台实现不同业务不同场景下的数据联动,例如构建统一的行内黑白灰名单库进行数据共享,以实现全行各类名单的维护及其联动调用!
2、统一资信平台业务架构
2.1、数据管理-数据源
为进一步提升银行的自主风控能力,加速数字化转型进程,银行为了补全内部风控缺失环节,需要引入外部大数据资源,服务于各项业务条线,因此会接入很多数据商(百融、前海、鹏元、人行征信、天眼查等),应用业务系统涉及零售线上业务、信用卡业务、对公业务等;在交互模式上,所有外部数据接口均由统一资信平台对接,其他应用系统通过与统一资信平台进行交互发查资信数据用于贷前审批、贷中监控、贷后管理。
数据来源:内部、外部,数据源为内外部原始数据,可以通过主动发查或者数据源推送的方式获取原始数据;
数据源基本定义:
- 数据来源:行内数据、行外数据
- 数据商编号:
- 数据商名称:
- 数据产品名称:
- 数据产品编号:
- 所属对象:个人、企业
- 是否需要提交授权书:
- 缓存有效期:
- 示例:行外数据|B000|百行|百行手机三要素核验|DS_HJKLHG|个人|是|14
- 示例:行外数据|B000|百行|百行手机状态核验 |BS_HJKLHG|个人|是|14
2.2、数据管理-场景库
场景是一个抽象化的理解,也就是说需要评估客户风险的都称之为一个场景,例如:贷前审查、贷款审批、贷中操作、贷后管理、信用卡审批、客户准入资格审查等场景;
1、场景的基本定义:
- 场景编号
- 场景名称
- 渠道
- 业务产品:
- 业务类型:贷前审查、贷款审批、贷中操作、贷后管理、信用卡审批、客户准入资格审查
- 场景状态:启用、停用
- 是否独立缓存:是、否
- 场景发查是否需要审核:是、否
- 示例:CJBH000013|中征码申领 |微众银行|微粒贷|贷款审批|已启用|是|否
- 示例:CJBH000014|银行卡四要素|微众银行|微粒贷|贷款审批|已启用|是|否
2、场景关联变量:
- 场景下选择关联原始变量:原始变量由数据源直接解析得到;
- 场景下选择关联衍生变量:衍生变量由原始变量加工获得,包括基于单数据源的加工变量、基于多数据源的加工变量;
3、场景缓存策略:
- 好处:资信缓存可以提高数据的响应效率,降低数据访问的成本和复杂度,提高数据的复用性和应用价值。
- 在接入时定义这个资信产品的缓存有效期,在数据采集时优先使用业务传入的有限期来满足不同业务场景对同一个资信产品的用数时效要求。
- 具体的判断逻辑如下:
- 资信产品采集成功后,部分资信产品的数据会缓存在DB中。同一个用户、相同请求参数再次发生采集时,会拿上次采集成功的时间跟当前时间做差和本次业务请求所要求的数据时效进行比较。
- 当前时间 - 相同请求上一次采集成功时间 <= 业务请求传入的天数(请求未传,取配置在产品的默认天数),则缓存数据有效返回缓存数据。
- 缓存策略流程图
3、统一资信平台系统定位
线上资信平台主要的作用就是用于接入外部数据,也就是通过它去获取一些外部数据,它本身不提供数据,它可以理解为一个获取外部数据的集中平台;
例如:一个人来银行贷款,银行首先进行评估能贷给这个人多少钱,这个是由决策系统决定的,但是如果只通过个人的一些基础信息决策系统是无法得出准确结论的,比如这个人是不是诈骗犯,是不是银行黑名单,是不是存在过失记录等,这些都会影响决策系统的决策结果,所以从资信平台获取相应数据显得很有必要!
资信平台做了哪些事情:接口的整合:将众多的接口整合成一个大接口,方便其他平台的调用;每一个接口都对应单独的接口码,以此来判断决定调用哪些接口;