文件名称:TFI:TFI Kaggle 竞赛提交代码
文件大小:121KB
文件格式:ZIP
更新时间:2024-06-26 07:57:31
此代码生成在 TFI Kaggle 竞赛排行榜上排名第 5 的提交。 见: : 和: : 这是一个非常轻微修改的代码版本,它产生了我们的官方最佳得分第 13 名提交(团队 Firefly)。 关于数据:提供的训练集只有 137 行! 每一行描述了土耳其的一家餐厅,由比赛赞助商 TFI 食品经营。 大多数特征都是匿名的,并标记为 P1 到 P38,它们似乎是分类的。 有一些更好的描述列,例如开业日期、餐厅类型和城市。 测试集官方有 100,000 行,但实际上大部分是由 Kaggle 人为生成的,没有评分。 我们和其他竞争对手确定真正的测试集只有 321 行。 目标是预测餐厅收入。 评分指标是 RMSE(均方根误差),它对异常值非常敏感,尤其是在如此小的训练集上。 所以这段代码的一般策略是只使用最简单和最可靠的预处理和建模技术(并避免过度拟合)。 作者:Ben Solecki 和
【文件预览】:
TFI-master
----train.ipynb(209KB)
----README.md(1KB)
----.gitattributes(483B)