NYCBuildingEnergyUse:在Google Cloud上创建建筑排放的回归模型

时间:2024-02-24 00:56:51
【文件属性】:

文件名称:NYCBuildingEnergyUse:在Google Cloud上创建建筑排放的回归模型

文件大小:7.31MB

文件格式:ZIP

更新时间:2024-02-24 00:56:51

data-science scikit-learn exploratory-data-analysis regression xgboost

关于 我最初是在一段时间前开始这个项目的,目的是获取有关建筑物能源使用的2016年纽约基准测试法数据,并对此做一些有趣的事情。 经过几次迭代后,我认为看看是否可以通过查看建筑物的年龄,用水量以及其他能耗指标来预测建筑物中温室气体的排放量可能会很有趣。 最终,该项目的目的是使用诸如以下各项的最新工具,使用具有异常值和缺失值的真实世界数据集在云上构建和部署模型。 笔记本概述 GreenBuildings1:探索性分析和异常值消除 在第一篇博文中,我将介绍如何执行数据清理的基础知识,包括: 探索性数据分析 识别和删除异常值 由于我将花费数天的时间并使用完成该项目,因此我将介绍使用存储数据集的基础知识,这样我就不必在每次工作时都从头开始。 在这篇博文的结尾,我将总结这些发现,并提出一些具体建议,以减少多户家庭和办公楼的能源消耗。 GreenBuildings2:使用Scikit-Learn估算缺失的价值 在第二篇文章中,我将介绍使用Scikit-Learn的使用缺失,该同时使用类的点估计(即均值,中位数)以及使用类的更复杂的回归模型(即KNN)。 后者要求将模型中的特征关联起来。 对于我们的


【文件预览】:
NYCBuildingEnergyUse-master
----notebooks()
--------utilities()
--------GreenBuildings1.ipynb(1.64MB)
--------images()
--------GreenBuildings2.ipynb(1.12MB)
--------GreenBuildings3.ipynb(367KB)
----start_notebook.sh(63B)
----model()
--------XGBModel()
--------README.md(193B)
--------app.yaml(83B)
----Dockerfile(1KB)
----requirements.txt(142B)
----LICENSE(1KB)
----README.md(6KB)
----data()
--------neighborhoods.pkl(3KB)
--------nyc_benchmarking_disclosure_data_reported_in_2016.xlsx(4.1MB)
--------nyc-zip-code-tabulation-areas-polygons.geojson(620KB)

网友评论