文件名称:Kaggle竞争
文件大小:1.4MB
文件格式:ZIP
更新时间:2024-03-08 13:32:11
JupyterNotebook
钻石价格预测! 欢迎来到这个很棒的项目 :red_exclamation_mark: 该项目的重点是以下步骤: :pushpin: 我们从Kaggle下载了一个数据集。 给定一些度量和特征后,该数据集是关于钻石价格的。 您可以在此处找到数据集和竞争的: :pushpin: 数据集分为两个子集。 第一个是“ train.csv”,我们用它来训练模型并预测第一个价格。 然后,我们加载了除了所有“价格”列以外都包含所有列的“ test.csv”,因此我们也预测了价格并将预测的价格附加到数据集中。 :pushpin: 我们对数据集进行了一些调整,以允许我们的回归模型对其进行分析并训练其自身(编码我们的字符串列并将其转换为整数)。 利用所有这些数据和一些时间来训练模型。 我们能够预测钻石的价格,并在获得该数据集的Kaggle竞赛中获得前三名! :pushpin: 最后,我们只使用“ id”列和“ price”列,并创建一些输出数据框以提交给Kaggle竞赛。 该项目使用的算法如下:
【文件预览】:
Kaggle-competition-main
----notebooks()
--------Gradient Booster.ipynb(60KB)
--------Adapting datasets.ipynb(83KB)
--------Binary Tree.ipynb(29KB)
--------Random forest.ipynb(38KB)
--------Linear Regression.ipynb(29KB)
----README.md(2KB)
----data()
--------train_final.csv(1.92MB)
--------test_final.csv(535KB)
--------submissions kaggle()
----.gitignore(2KB)