在智能交通系统(ITS)中,用已有交通数据准确、实时预测未来短期交通流量,对城市交通规划、交通管理和控制很重要。短期交通流预测是要预测某条道路在未来几分钟或几小时交通流的变化情况(流量、速度等)。 交通流量预测方法可分为三类:统计方法模型、传统机器学习模型和深度学习模型。
一、统计方法模型
1.1 HA模型(History Average Model)
Stephanedes 于1981 年将HA模型应用于城市交通控制系统。 算法定义
V(new):某路段在一定时间间隔内的新的交通流量;V(old):该路段在一定时间间隔内的旧的交通 流量;V为最近观察到的该路段在一定时间间隔内的交通流量;α为平滑系数。
[1]J. Liu and W. Guan, “Asummary of traffic flow forecasting methods,”J. Highway Transp.Res.Develop., vol. 21, no.3, pp.82–85, Mar.2004.
HA优缺点:
优点:算法简单 ,参数可用最小二乘法 (LS)在线估计,可以在一定程度内解决不同时间、不同时段里的交通流变化问题。
缺点:静态预测,没有考虑当前交通 状态变化所带来的影响,不能反映动态交通流的不确定性与非线性特性,无法克服随机干扰因素的影响,不能应对交通系统中的突发事件,如事故。
1.2 Time-Series Model
按时间顺序排列的观测值的集合称为时间序列。利用时间序列观测值之间的依赖关系和相关性,可进行动态预测。
ARIMA模型(Autoregressive Integrated Moving Average model),Box-Jenkins模型[2]。
基本思想:将预测主体随时间变化形成的序列看作一个随机时间序列,通过若干次差分使非平稳数据转化为平稳序列,再用数学模型近似描述该随机序列。
[2]M.S. Ahmed and A.R.Cook,“Analysis of freeway traffic time-seriesdata by using Box-Jenkins techniques,” Transp.Res.Rec.,no.722,pp.1–9,1979.
ARIMA
优点:简单、短期预测效果不错
不足: 只能捕捉线性关系,不能捕捉非线性关系; 适用于稳定的交通流,若交通状况变化急剧,则不适用; 单变量时间序列模型,是自身若干历史时刻的值作为输入变量的,未考虑其上下游交通流在过去时刻值对其所产生的影响。
1.2 Time-Series Modle
1980年,由计量经济学家和宏观经济学家Christopher Sims提出VAR模型(Vector Autoregressive model)。VAR模型使变量扩充到两个及多个以上,因此经常用在多变量时间序列模型的分析中。
VAR优缺点:
优点: 分析多元时间序列的模型,能较好地实时反映出交通流的波动,尽可能减少预测过程中的不确定性。与传统的统计方法相比,VAR在预测精密度和精准度上有突出的优势。
缺点:需要估计的参数较多
二、传统机器学习模型
2.1 KNN
K近邻是非参数回归中最常用的方法之一。 构建容量够大且有代表性的历史数据库。 对历史数据库进行筛选,识别错误,去除冗余。按已设定的非参数模型的相关要素(状态向量、距离度量准则、近邻值K的选取以及预测算法)从历史数据库中找到与当前实时观测数据相匹配的近邻。 用预测算法得到下一时刻的交通预测量。
2.2 SVR[3]
基本思路:以交通检测器收集到某时刻前几时段及上下游前几时段的交通流量、占有率、平均速度等交通参数为输入,以对应时段交通流量为输出,选取核函数,对支持向量回归机进行训练。应用训练完成的支持向量回归机,输入交通流量、占有率、平均速度,预测下时段的交通流量.
[3]A.J.Smola and B. Schölkopf, “A tutorial on support vector regression,”Statist. Comput.,vol.14, no. 3, pp. 199-222, Aug.2004.
三、深度学习模型
3.1 ST-ResNet[4]
基本思路:利用三个残差网络单元建模拥挤交通的period、closeness和trend,聚集它们的输出,并和一些额外的因素(例如天气、日期)进行合并,预测每个区域的流入量和流出量。
[4]Zhang J,Zheng Y,Qi D. Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction[C]//AAAI. 2017: 1655-1661
ST-ResNet主要由四部分组成:closeness,period,trend,external。
3.2 DMVST-Net[5]
基本思路:采用多视角(Spatial View, Temporal View, Semantic View)对问题进行建模处理。通过历史订单数据来预测下一时刻城市中区域的出租车订单量demand prediction。
创新:同时从 spatial,temporal 和 semantic 多视角角度出发,综合考虑了出租车需求在路网上分布的时空关系,利用语义信息,对相似区域的时空模式进行了建模。
[5]Huaxiu Yao, Fei Wu et al.Deep Multi-View Spatial-Temporal Network for Taxi Demand Prediction.AAAI 2018.
3.3 ASTGCN[6]
基本思路:同时采用图卷积和注意力机制去对网络结构形式的交通数据进行建模。
创新: 1)提出时空注意力机制学习交通数据的动态时空相关性。空间注意力机制建模不同位置空间相关性。时间注意力机制捕获不同时刻的动态时间相关性; 2)设计时空卷积模块,建模交通数据的时空相关性。
[6]Shengnan Guo,Youfang Lin et al.Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting.2019 AAAI.
ASTGCN模型包含三个主要部分,分别用来对recent、daily-period、weekly-period进行建模(输入依次为),提取依赖特征。三部分具有相同的网络结构,每部分由多个时空卷积模块和一个全连接层组成。在每个时空块中都有时空注意力模块和时空卷积模块。(为优化训练效率,采用残差连接。)
最后,利用一个参数矩阵对三个分量加权合并,得到最终预测结果。