基于信用卡逾期数据的Spark数据处理与分析(Python)

时间:2024-03-01 15:05:31

《大数据处理技术Spark》这门课需要完成对一个数据集进行数据预处理、数据存储、数据处理与分析、数据可视化。也就是一个大数据的基本处理流程。

本案例以和鲸社区的信用卡评分模型构建数据为数据集,以Python为编程语言,使用大数据框架Spark对数据进行处理分析,并对分析结果进行可视化。

具体内容可参考厦门大学数据库实验室Spark案例处理集锦