文件名称:House-Prices-Challenge-Solution:我对Kaggle房价挑战的解决方案
文件大小:3.23MB
文件格式:ZIP
更新时间:2024-04-06 06:08:01
unit-testing data-science machine-learning numpy sklearn
预测房价 这个仓库是什么? 作为即将到来的机器学习工程师,我挑战自我以测试自己的机器学习技能。 我通过应对的向自己。 这项挑战的目标是根据一组给定的功能预测爱荷华州埃姆斯的房屋价格。 确切地说,总共有79个功能。 该项目使工程师(在本例中为我本人)可以练习关键的数据科学和机器学习技术。 该存储库通过4个文件夹进行组织:提交,数据,代码和模型。 在“提交”文件夹中,您将看到我所做的各种提交。 在“数据”文件夹中,您将找到必要的数据集以及任何其他必要的信息。 在“代码”文件夹中,您将看到该项目的各种Jupyter笔记本和Python脚本。 最后,在models文件夹中,您将看到我保存的各种模型。 该模型是使用均方根误差来评估的,因为这是我们试图最小化的指标。 我最好的模型的RMSE为0.13757 。 目前排名前43% 。 实际上,我的解决方案要高得多,因为1)一些解决方案的RMSE值不
【文件预览】:
House-Prices-Challenge-Solution-master
----Submissions()
--------submission1.csv(34KB)
--------submission7.csv(34KB)
--------submission5.csv(34KB)
--------submission10.csv(34KB)
--------submission4.csv(34KB)
--------submission2.csv(34KB)
--------submission8.csv(34KB)
--------submission3.csv(34KB)
--------submission6.csv(34KB)
--------submission9.csv(34KB)
----Text Files()
--------models.txt(267B)
--------Final-Exploration-Findings.txt(2KB)
--------unittests_results.txt(308B)
--------feature-ideas.txt(289B)
----Models()
--------tuned_catboost1.cbm(428KB)
--------lin_reg.sav(4KB)
----.idea()
--------misc.xml(219B)
--------other.xml(186B)
--------csv-plugin.xml(1KB)
--------inspectionProfiles()
--------modules.xml(314B)
--------.gitignore(176B)
--------House-Prices-Challenge-Solution.iml(419B)
--------vcs.xml(180B)
----README.md(4KB)
----Code()
--------Jupyter Notebooks()
--------Scripts()
----Data()
--------Prepared Data()
--------Raw-Data()
--------data_description.txt(13KB)