【文件属性】:
文件名称:BCG:该存储库包含我在BCG GAMMA上的虚拟体验方面的工作
文件大小:1.02MB
文件格式:ZIP
更新时间:2021-04-09 05:47:50
JupyterNotebook
虚拟体验卡介苗
该存储库包含我在BCG GAMMA上的虚拟体验方面的工作。
感谢Ken Jee提供了在GitHub上记录项目的通用框架。 访问和
使用的代码和资源:
的Python版本:3.7
包装:熊猫,numpy,sklearn,matplotlib,seaborn。
合成样本的生成: :
1.探索性数据分析(EDA)
加载数据中
数据框的统计
数据可视化
数据清理
固定格式
2.特征工程
创建新功能(领域知识,互动,分组)。 一个很好的阅读资源: :
数据转换:大多数功能向右倾斜。 我使用了日志转换。
获取用于分类特征的虚拟变量。
将数据分为训练和测试
离群值检测
3.建模与评估
我实现了朴素贝叶斯算法作为基线模型。 ROC-AUC得分:60.49
运行基线模型后,我使用了健壮的模型:随机森林,决策树,梯度提升,AdaBoosting和XGBoost。 Xgbo
【文件预览】:
BCG-main
----README.md(2KB)
----Churn_Prediction.ipynb(47KB)
----Feature_Engineering.ipynb(949KB)
----Exploratory Data Analysis.ipynb(665KB)