文件名称:kaggle-titanic:Kaggle Titanic Comp
文件大小:63KB
文件格式:ZIP
更新时间:2024-07-26 10:50:24
Python
泰坦尼克号 这是我在参加 Kaggle 泰坦尼克号比赛时编写的 python/scikit-learn 代码。 有几种不同算法的代码,但主要和性能最高的一种是在 randomforest2.py 中实现的 RandomForest。 要求: python(2.x 版本至少为 2.6) scikit-learn/NumPy/SciPy ( ) 熊猫( ) matplotlib ( ) 用法: > python randomforest2.py 关键文件: loaddata.py:包含所有特征工程,包括用于生成不同变量类型、执行 PCA、聚类和类平衡的选项 randomforest2.py:执行管道的代码 scorereport.py:检查并报告超参数搜索的结果 learningcurve.py:包括生成学习曲线的代码 roc_auc:包括生成 ROC 曲线的代码 其他文
【文件预览】:
kaggle-titanic-master
----.gitignore(66B)
----naivebayes_gaussian.py(3KB)
----myfirstforest.py(7KB)
----sgdclassifier.py(7KB)
----genderclassmodel.py(5KB)
----randomforest2.py(9KB)
----data()
--------results()
--------raw()
----__init__.py(0B)
----learningcurve.py(3KB)
----naivebayes.py(3KB)
----README.md(1KB)
----gendermodel.py(4KB)
----loaddata.py(21KB)
----svc.py(5KB)
----roc_auc.py(2KB)
----scorereport.py(2KB)