king-county-house-sales:金县房屋销售数据的线性回归建模

时间:2021-04-14 07:26:51
【文件属性】:
文件名称:king-county-house-sales:金县房屋销售数据的线性回归建模
文件大小:5.24MB
文件格式:ZIP
更新时间:2021-04-14 07:26:51
JupyterNotebook 金县房屋销售线性回归 金县房屋销售数据的线性回归建模 小组成员 安德鲁·穆勒(Andrew Muller) 阿舍尔·汗(Ashe Khan) 商业案例 我们将预测应该出售多少房屋,以便确定市场上的房屋是定价过低还是定价过高。 我们的客户是希望出售房屋的房主,但不知道卖多少钱。 数据分析 我们获得了column_names.md文件中该列的信息。 将所有数据转换为数值数据类型后,我们将处理所有NaN值并创建一些新功能:“ yr_since_renovation”,“ yr_since_built”和“ renovated”。 然后,我们删除不需要的功能:“视图”,“ sqft_above”,“ sqft_living15”,“ sqft_lot15”和“日期”。 清理数据后,我们开始对其进行分析。 每个变量相对于我们的目标价格的散点图显示了我们哪些变量具有明显的线性关系。 当我们开始查看
【文件预览】:
king-county-house-sales-main
----.gitignore(2KB)
----README.md(4KB)
----figures()
--------final-qq-plot.png(15KB)
--------final-residuals-plot.png(18KB)
--------heatmap-before.png(83KB)
--------heatmap-after.png(83KB)
--------baseline-qq-plot.png(15KB)
--------scatter-plots.png(216KB)
--------histogram-plots.png(98KB)
----notebooks.pdf(1.32MB)
----notebooks()
--------5-final-model-analysis.ipynb(13KB)
--------4-iterative-modeling.ipynb(183KB)
--------2-exploratory-data-analysis.ipynb(607KB)
--------1-data-cleaning.ipynb(68KB)
--------3-feature-engineering.ipynb(117KB)
----presentation.pdf(1.71MB)
----data()
--------cleaned_data.csv(1.91MB)
--------test.csv(1.3MB)
--------train.csv(3.88MB)
--------kc_house_data.csv(2.34MB)
--------column_names.md(1KB)
--------final_model.csv(3KB)

网友评论