文件名称:meilleur-data-scientist-france-2018:我的竞赛“ Le meilleur法国数据科学家2018”的解决方案(法国最佳数据科学家2018)
文件大小:24KB
文件格式:ZIP
更新时间:2024-06-04 23:39:31
data-science machine-learning xgboost data-science-competition JupyterNotebook
法国Meilleur数据科学家2018 这是我参加为时2小时的比赛“ Meilleur法国数据科学家2018”(法国2018年最佳数据科学家)的代码。 我的多重对数得分为0.95629,在233个排名中排名第44(有350多个参与者) 语境 这是一项竞争活动,旨在预测在LabelEmmaüs市场上的销售时间。 LabelEmmaüs是Emmaüs的分支机构,Emmaus是法国最著名的非营利组织之一,以向流浪者提供衣服而闻名。 标签Emmaüs是他们在法国最脆弱的人群中雇用的市场,利润被重新注入Emmaüs。 难点 1. 2小时非常短 我挣扎了一个小时来提高基线。 然后我又损失了30分钟,因为我们必须输出3个概率(在0-10天,10-60天和60+天之间卖出),但是XGBoost并不是按照自然顺序对输出列进行排序。 2.数据集 限制了automl / datascience平台
【文件预览】:
meilleur-data-scientist-france-2018-master
----src()
--------star_command.py(5KB)
--------instrumentation.py(875B)
--------metrics.py(760B)
--------cache.py(1KB)
--------preprocessing()
--------xgb_processing.py(4KB)
----tuto_Python()
--------MDSF2018 - Tutoriel Python 3 - Azure ML Studio.ipynb(10KB)
--------MDSF2018 - Tutoriel Python.ipynb(46KB)
----m110_feat_eng.py(1KB)
----README.md(1KB)
----tuto_R()
--------MDSF 2018 - Tutoriel R.Rmd(7KB)
----.gitignore(54B)
----m000_baseline.py(3KB)