Amazon:Kaggle亚马逊竞赛

时间:2024-06-08 07:44:01
【文件属性】:

文件名称:Amazon:Kaggle亚马逊竞赛

文件大小:46KB

文件格式:ZIP

更新时间:2024-06-08 07:44:01

Python

该代码产生了Kaggle亚马逊访问竞赛第一名代码的一部分。 我的搭档Paul Duan负责其他部分。 当时,我们还具有用于混合各种模型输出的代码。 请参阅: : 和: : 还包括一个使用相同数据的ipython笔记本。 我用这个笔记本向匹兹堡Python用户聚会小组介绍了scitkit学习和随机森林算法的实用介绍。 关于数据:目标是根据分类的职位描述数据预测员工的资源访问权限。 评分标准为AUC(ROC曲线下的面积)。 只有9个分类输入要素列,其中之一是完全多余的。 大约有30,000个训练行和50,000个测试行。 关于本规范:总体策略是产生2个特征集:一个特征集要使用基于决策树的方法建模,第二个特征集是通过将所有分类值以及分类值的二阶和三阶组合二值化而创建的稀疏二进制特征矩阵。 后者的功能可以使用Logistic回归,SVM等进行建模。Miroslaw Horbal


【文件预览】:
Amazon-master
----.gitattributes(483B)
----logistic_features.py(12KB)
----README.md(2KB)
----ensemble.py(5KB)
----.gitignore(606B)
----SklearnDemo.ipynb(86KB)

网友评论