文件名称:noshows:根据约会数据预测不出现
文件大小:15.4MB
文件格式:ZIP
更新时间:2024-04-08 01:52:13
JupyterNotebook
在未预约的数据集( )(患者约会的数据集)上,我们试图预测患者是否愿意参加约会。只有大约1/4的患者没有出现,并且在此回购中,我们显示出通过生成更多的没有出现,我们可以改善患者没有出现分类器的性能。查看以下结果: 原始数据集结果: 模型 准确性 AUC 记起 精确 F1 河童 我的客户中心 TT(秒) 助推器 CatBoost分类器 0.8026 0.7461 0.0778 0.5843 0.1372 0.0942 0.1582 14.866 lightgbm 轻梯度升压机 0.8015 0.7433 0.0376 0.6444 0.0711 0.05 0.1204 39.915 xgboost 极端梯度提升 0.8003 0.7431 0.092 0.5332 0.1569 0.1035 0.1567 6.864 射频 随机森林分类器 0.
【文件预览】:
noshows-master
----.ipynb_checkpoints()
--------Predicting_patient_noshows-checkpoint.ipynb(263KB)
----best_copula.pkl(35.5MB)
----synth_data.csv(3.72MB)
----old_synth_data.csv(3.72MB)
----.DS_Store(6KB)
----prep_pipe.pkl(150KB)
----catboost_info()
--------learn()
--------learn_error.tsv(16KB)
--------time_left.tsv(14KB)
--------catboost_training.json(95KB)
----README.md(10KB)
----logs.log(337KB)
----Predicting_patient_noshows.ipynb(431KB)
----generate_data.py(4KB)
----KaggleV2-May-2016.csv(10.24MB)
----generate_data_simple_fit.py(3KB)