BCG:该存储库包含我在BCG GAMMA上的虚拟体验方面的工作

时间:2024-04-28 23:34:30
【文件属性】:

文件名称:BCG:该存储库包含我在BCG GAMMA上的虚拟体验方面的工作

文件大小:1.02MB

文件格式:ZIP

更新时间:2024-04-28 23:34:30

JupyterNotebook

虚拟体验卡介苗 该存储库包含我在BCG GAMMA上的虚拟体验方面的工作。 感谢Ken Jee提供了在GitHub上记录项目的通用框架。 访问和 使用的代码和资源: 的Python版本:3.7 包装:熊猫,numpy,sklearn,matplotlib,seaborn。 合成样本的生成: : 1.探索性数据分析(EDA) 加载数据中 数据框的统计 数据可视化 数据清理 固定格式 2.特征工程 创建新功能(领域知识,互动,分组)。 一个很好的阅读资源: : 数据转换:大多数功能向右倾斜。 我使用了日志转换。 获取用于分类特征的虚拟变量。 将数据分为训练和测试 离群值检测 3.建模与评估 我实现了朴素贝叶斯算法作为基线模型。 ROC-AUC得分:60.49 运行基线模型后,我使用了健壮的模型:随机森林,决策树,梯度提升,AdaBoosting和XGBoost。 Xgbo


【文件预览】:
BCG-main
----README.md(2KB)
----Churn_Prediction.ipynb(47KB)
----Feature_Engineering.ipynb(949KB)
----Exploratory Data Analysis.ipynb(665KB)

网友评论