文件名称:tradeshift-text-classification:这是 Kaggle 机器竞赛的第一名解决方案
文件大小:508KB
文件格式:ZIP
更新时间:2024-07-27 07:26:44
Python
此代码从我们的团队“carl and snow”生成了 Tradeshift 文本分类的第一名解决方案 它主要包括两种模型: 使用 Xgboost 和 sklearn 的两阶段模型。 在线逻辑回归。 依赖关系 Python 2.7 pypy 2.4.0 Scikit learn-0.15.2 numpy 1.7.1 scipy 0.11.0 Xgboost 0.3 要生成解决方案: 设置所有依赖 更改 run.py 中的数据目录 更改 ./src/xgb_classifier.py 中的 xgboost 包装器路径 Python运行.py 最佳单解:xgb-part1-d18-e0.09-min6-tree120-xgb_base.csv private LB 0.0044595 最佳集成解决方案:best-solution.csv 私有 LB 0.0043324(第一名)
【文件预览】:
tradeshift-text-classification-master
----run.py(4KB)
----src()
--------ensemble.py(641B)
--------best_online_model.pyc(7KB)
--------xgb_classifier.pyc(3KB)
--------pre-processing-base-old.py(3KB)
--------online-model()
--------xgb_meta_random_split_predict.py(2KB)
--------xgb_meta_part1_predict.py(5KB)
--------pre-ensemble.py(641B)
--------pre-processing-base.py(3KB)
--------other_model.py(3KB)
--------submission_to_feature.py(573B)
--------pre-processing-meta-part1.py(4KB)
--------xgb_meta_part2_predict.py(3KB)
--------run_online.py(2KB)
--------evaluate.py(595B)
--------ensemble()
--------pre-processing-meta-random-split.py(3KB)
--------xgb_classifier.py(3KB)
--------tool.py(1KB)
--------counter_old.pyc(7KB)
--------pre_processing_best_online.py(1KB)
--------pre-processing-meta-part2.py(4KB)
--------tool.pyc(2KB)
--------best_online_model.py(8KB)
--------counter_old.py(6KB)
----reset.sh(24B)
----README.md(724B)
----TradeshiftTextClassification.pdf(447KB)