文件名称:kaggle-otto-group:Kaggle的Otto集团产品分类挑战
文件大小:6KB
文件格式:ZIP
更新时间:2024-05-29 16:42:38
Python
Kaggle的Otto集团产品分类挑战 介绍 这是我针对代码。 我在博客中有关该解决方案的文章。 最终模型通过堆叠使用两个级别的集合。 30次奔跑可获得0.4192的私人LB(前5%)。 级别1和级别2的训练数据大致分为1:1,并且可以对其进行微调以获得更好的结果。 这项比赛吸引了我,因为: 论坛上有很多竞争对手和解决方案可供学习。 功能工程非常有限,因此我可以专注于尝试不同的模型。 使用模型集成的好机会。 依存关系 CUDA工具包7.0 Python 2.7.6 千层面0.1.dev 无学习0.5 numpy的1.8.2 熊猫0.13.1 scikit学习0.16.1 scipy 0.13.3 Theano 0.7.0 xgboost 0.4 跑步 将数据放入data目录 运行python ensembler.py
【文件预览】:
kaggle-otto-group-master
----data()
--------train.csv(0B)
--------sampleSubmission.csv(0B)
--------test.csv(0B)
----model()
--------level2.py(3KB)
--------__init__.py(0B)
--------level1.py(6KB)
----ensembler.py(859B)
----auxiliary.py(812B)
----README.md(1KB)