文件名称:zillow-clustering-project:该项目使用聚类模型从Zillow数据集中预测对数错误
文件大小:13.83MB
文件格式:ZIP
更新时间:2024-04-26 20:49:01
JupyterNotebook
Zillow集群项目 该项目使用聚类模型从Zillow数据集中预测对数错误。 在本自述文件中,我们将: 说明什么是项目。 解释如何重现我们的作品。 包含项目计划中的注释。 目标 利用zillow数据集可以找到导致Zestimates错误的原因。 -使用2017年属性和预测数据的单户/单户住宅。 主要发现 项目计划 用于计划的看板板 Data Acquisition :使用适当SQL查询从代码云数据库中收集数据 Data Prep :列数据类型适用于它们包含的数据 Data Prep :缺失值将得到调查和处理 Data Prep :对异常值进行调查和处理 Exploration :使用可视化和统计测试来探索自变量与目标变量之间的相互作用 Exploration :聚类用于探索数据。 在统计测试和可视化的支持下,得出了关于集群是否有用/有用的结论。 至少应尝试3种组合特征进行聚类。
【文件预览】:
zillow-clustering-project-main
----brandons_sandbox()
--------utilities()
--------explore.py(11KB)
--------wrangle.py(12KB)
--------brandon_scratch_notebook.ipynb(358KB)
----zillow.csv(23.79MB)
----.gitignore(2KB)
----README.md(4KB)
----explore.py(11KB)
----prepare()
--------__init__.py(0B)
--------prepare_zillow.py(4KB)
----acquire()
--------acquire_zillow.py(1KB)
--------__init__.py(0B)
----wrangle.py(16KB)
----model.py(2KB)
----david_scratch_notebook.ipynb(4.97MB)
----zillow_clustering_project_final.ipynb(4KB)
----wrangle_zillow.py(834B)
----brandon_scratch_notebook.ipynb(21.94MB)