文件名称:matlab精度检验代码-higgs:希格斯玻色子挑战代码
文件大小:52KB
文件格式:ZIP
更新时间:2024-06-10 19:43:12
系统开源
matlab精度检验代码希格斯玻色子挑战赛刚刚结束在Kaggle.com上,我在1785个团队中参加了98场比赛,以创建正确分类希格斯玻色子事件的机器学习流程。 由CERN(大型强子对撞机人员)和Kaggle组织,参与者获得了250000个事件的训练集和550000个事件的测试集。 数据由30个变量组成,描述了在高能质子-质子碰撞中产生的粒子的动量和其他特征。 希格斯玻色子在此数据集中特别难以分类,因为由希格斯衰变产生的粒子与另一种相互作用衰减路径非常相似。 有很多噪音,但没有太多信号。 这是一个巨大的挑战,有很多竞争对手,很多讨论和很多教训。 这是我采取的方法。 流 对于挑战,我使用了Python,iPython Notebook,Sci-kit Learn,MongoDB以及8核和32核AWS EC2 Ubuntu服务器(以及值得信赖的2008 MacBook Pro)。 像许多其他人一样,我使用了达林·鲍姆加特尔(Darin Baumgartel)的入门套件进行了编码,编码非常好。 我最终保留了评分指标计算,权重归一化和csv提交代码。 挑战赛中许多人首选的分类算法是xgboos
【文件预览】:
higgs-master
----data_prep-ln-2split.ipynb(8KB)
----withHyperopt-xgboost.ipynb(19KB)
----stackerAVG.ipynb(13KB)
----stackerAVG.py(9KB)
----higgs_lib.ipynb(2KB)
----hyper_lib.py(1KB)
----data_prep-ln-2split.py(6KB)
----withBagging-xgboost.ipynb(44KB)
----README.md(6KB)
----hyper_lib.ipynb(2KB)
----withBagging-xgboost.py(10KB)
----hyper_lib.pyc(2KB)
----higgs_lib.pyc(2KB)
----withHyperopt-xgboost.py(10KB)
----higgs_lib.py(1KB)