文件名称:kaggle-CrowdFlower:在Kaggle上CrowdFlower产品搜索结果相关性竞赛的第一名解决方案
文件大小:5.33MB
文件格式:ZIP
更新时间:2024-02-24 09:03:44
nlp natural-language-processing kaggle search-relevance semantic-matching
Kaggle_CrowdFlower 第一名的解决方案 我们在比赛中获得的最佳单一模型是模型,其中公共LB得分为0.69322 ,私人LB得分为0.70768 。 我们最终的获奖作品是35个最佳公共LB作品的中位数合计。 该提交关于私人LB的得分0.70807公共LB和0.72189 什么是新的 2016/05/14:有关此代码和框架的更干净,模块化的版本,您可能需要查看 ,其中包含针对最近进行的的Turing Test解决方案的代码。 流程图 文献资料 有关文档,请参见./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf 。 指令 从下载数据,并将所有数据放入文件夹./Data 。 运行python ./Code/Feat/run_all.py生成功能。 这将需要几个小时。 运行python ./Code/Model/generate_best_single_model.py生成最佳的单个模型提交。 根据我们的经验,只需进行几次试验即可生成最佳性能或相似性能的模型。 例如,请参阅./Output/Log/[Pre@solution]_[Feat@