文件名称:Diamonds-everywhere:通过不同的机器学习模型,根据钻石的特征预测钻石价格。 使用Hyperopt和Pycaret
文件大小:1.22MB
文件格式:ZIP
更新时间:2024-04-25 16:59:04
JupyterNotebook
钻石无处不在 介绍 在世界上,钻石因其美观和特性而成为人们最垂涎的对象。 他们昂贵的采购和稀缺性使钻石产品在市场上具有很高的价值。 但是,可以根据钻石的特性计算出该值吗? 在这个项目中,我们打算使用监督学习来创建预测模型,该模型使用一系列钻石变量来预测其他钻石的市场价值。 过程 打扫 清理过程首先检查数据集。 发现存在分类变量和数字变量的地方。 还观察到没有空值。 消除了无用的列,并对分类变量进行了编码,我们选择按序数形式对它们进行分类,因为存在分类顺序,因此考虑到顺序,将分类值替换为数值。 造型 使用的模型是线性回归,使用HyperOpt选择超参数的随机森林Reggresor,以及由Pycaret选择的第三个模型,最终将成为LightGradientBoostingMachine。 使用的度量是“ mean_square_error”。 数据 该项目使用的数据数据是从以下获得的
【文件预览】:
Diamonds-everywhere-main
----.gitignore(71B)
----Cleaning.ipynb(128KB)
----Model1-LinearRegression.ipynb(14KB)
----output()
--------Pycaret.csv(304KB)
--------RandomForest.csv(304KB)
--------linearregression.csv(304KB)
----data()
--------test_clean.csv(401KB)
--------train_clean.csv(1.51MB)
----src()
--------utils.py(467B)
----README.md(1KB)
----Model3-Pycaret.ipynb(302KB)
----Model2-RandomForest.ipynb(16KB)