房地产数据分析(四)

时间:2024-03-30 11:14:37

3 房价的评估与预测

3.1 房价评估

1)总体概述

本模型针对更加精细化的数据处理,来达到对某一具体房屋(具有楼层、户型、面积、区域、小区等具体信息)的房价进行评估和预测。

2)模型的选择

线性回归模型

(3)预测评估

已有的数据中,影响成交价格的因素主要包括成交面积、成交时间、楼层,其中楼层和成交价格之间不是正相关关系,但是可以根据楼层信息,对楼层数据进行处理,划分成不同的等级,不同的楼层房屋处于相应的等级,便可以与成交价格正相关关系,所以经过sklearn的linear_model模型训练,得到成交价格和成交面积、成交时间、楼层之间的多元线性回归方程,如图:

用于线性回归模型训练的数据主要包括成交价格、建筑面积、楼层、交易时间等信息,数据结构如图17所示

房地产数据分析(四) 

17 数据结构特点

18寻找到建筑面积和成交价格之间以及楼层和房价之间具有一定的相关关系,所以本线性回归模型的训练主要是基于成交价格和建筑面积、楼层之间建立。

                        房地产数据分析(四)

18 变量之间的相关关系

19展示了对成交价格、建筑面积、楼层这几项数据的回归训练结果,其中选取的数据是甘井子区的2017年的数据,训练之后我们对模型预测结果进行测试,如图19所示

房地产数据分析(四) 

19 模型预测结果

此模型的实际应用价值在于房屋买卖的过程中,可以利用此模型对相应的房屋进行价格评估,防止出现贵买贱卖的情况。在真正的达到这个应用层面的时候,我们需要更加精细化的处理,需要更多的影响房价的实际因素,比如距离中心区域的距离、房屋的结构等等。

3.2 房价预测

(1)总体概述

本模型针对宏观的整个大连市的数据处理,来达到对大连市整体房价的走势预测,达到对未来大连市房地产市场的平均房价的走势精准判断,在房价走高等情况下,通过*相关政策出台,来维持房市平稳运行,民生稳定发展。

(2)预测模型的选择

GM灰色理论模型,即小样本,贫信息不确定,即部分信息已知部分信息未知介于黑色理论和白色理论之间。

(3)选取GM模型的原因

a.灰色预测在形式上只运用预测对象自身的时间序列建立模型。与其相关联的因素表面上没有参与运算和建模,并不是说那些因素对预测对象没有影响和作用从而影响模型的全面性。灰色系统的“灰”正体现在任何一个客观系统究竟含有多少因素是难以说清楚的。这些因素之间的结构关系难以准确描述,更无法精确计算,转化成对预测结果的一个量化影响。灰色系统理论把这样受众多因素影响,又无法确定其复杂关系的量称为灰色量。对灰色量进行预测不必拼凑数据,不必过分关注那些数据不准、关系不清、变化不明的参数。那些主要的、次要的、直接的、间接的、己知的、未知的、明显的、隐含的众多因素相互联系、相互制约、协同作用的结果已经表现在动态变化的时间序列数据中。

b.不追求大样本量。所以灰色预测不追求大量历史数据,也不强求它的典型分布,通过对对离散的、规律性不强的数据(但是对单调变化的数据预测更加准确)进行合理的技术处理,通过建立模型在更高的层次上对系统动态过程进行科学的描述。典型的数据分析模型GM模型

c.房地产的交易数据正适合于以上两个特点,所以在房价预测方面我们选取灰色系统理论的GM模型来进行预测。

(4)预测精度评估

代码:

 

 房地产数据分析(四)

GM模型预测结果:

2 GM模型群预测结果

序号

2008

2009

2010

2011

2012

2013

2014

2015

2016

2017

原始数据

6187.5

7870.4

9463

11076.2

9076.4

11180.6

10531.9

10185.3

10937.9

12023.5

模型1

6673.40

9132.52

9565.33

10018.66

10493.47

10990.79

11511.67

12057.25

12628.67

13227.18

模型2

 

8450.03

10256.11

10596.28

10947.74

11310.85

11686.01

12073.6

12474.06

12887.80

模型3

 

 

10034.52

11322.67

11531.42

11744.02

11960.55

12181.06

12405.64

12634.36

模型4

 

 

 

10064.84

13054.79

12858.59

12665.33

12474.98

12287.48

12102.81

模型5

 

 

 

 

12366.43

13643.51

13171.98

12716.74

12277.25

11852.94

平均值

6985.52

8761.36

9933.13

10487.40

11669.04

12100.76

12191.37

12294.17

12409.37

12537.21 

序号

2018

 

 

 

 

 

 

 

 

 

模型1

 

 

 

 

 

 

 

 

 

 

模型2

 

 

 

 

 

 

 

 

 

 

模型3

 

 

 

 

 

 

 

 

 

 

模型4

 

 

 

 

 

 

 

 

 

 

模型5

 

 

 

 

 

 

 

 

 

 

平均值

12655.57

 

 

 

 

 

 

 

 

 

 

误差检验之后,满足误差校验的标准,相对误差检验中平均误差为0.0542,大于0.05、小于0.10,精度为三级;均方差比值C = 0.4353 <0.50、C= 0.4353 >0.35, 精度为二级。根据预测结果,2018年大连市平均房价为12655.57,将保持继续增长的趋势,而根据18年房地产市场的变化,我们将验证房价继续增长的特点。