北京交通大学万怀宇:时空交通数据预测方法及应用

时间:2024-10-28 07:19:15

⬆⬆⬆ 点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

2020年9月25-26日,2020年中国科技峰会系列活动青年科学家沙龙将迎来新的一期—“人工智能学术生态与产业创新”。本次活动由中国科学技术协会主办,清华大学计算机系、AI TIME、智谱·AI承办;大会完整视频报告,请在B站关注“AI Time论道”,或点击下方“阅读原文”。

9月26日上午,大会邀请到北京交通大学计算机与信息技术学院万怀宇副教授做了名为《时空交通数据预测方法及应用》的主题演讲。

对于时空交通数据的应用AI Time在KDD 2020顶会论文分享中分享了《基于时空孪生神经网络的轨迹识别》点击查看,它通过时空交通数据进行出租车驾驶员身份识别,可以应用到本次分享中提到的时空轨迹数据。

在演讲中,万怀宇老师介绍了时空交通网络的概念,分别介绍了他在时空栅格数据和时空图数据方面的研究成果,最后分享了这些研究在实际应用中的一些实例。

万老师个人主页:/8793/

万怀宇,博士,副教授,博士生导师,现任计算机与信息技术学院计算机科学系副主任。2012年博士毕业于北京交通大学;2013年至2014年在清华大学计算机系从事博士后研究工作(合作导师:唐杰)。中国中文信息学会社会媒体处理(SMP)专委会常务委员、秘书,中国计算机学会(CCF)会员,中国人工智能学会(CAAI)会员,IEEE member。期刊《Data Intelligence》编委。主要研究方向为数据挖掘与信息抽取,具体研究兴趣包括时空数据挖掘、社交网络分析与挖掘、用户行为分析、文本信息抽取等。已在AAAI、ICDE、ECML PKDD等会议和IEEE TITS、KBS、JAMIA等期刊发表学术论文30余篇。

本文是AI Time对报告主要内容的简单整理:

一、什么是时空交通数据

首先简单了解时空交通数据是什么。交通是一个属于国民生产生活中特别大的行业,比如铁路的交通网络、公路的交通网络、民航航线的交通网络、城市中与交通相关的网络,包括轨道交通,甚至说移动通信领域各个基站组成的蜂窝网络都可以看成是一种交通场景。从这些例子可以看到,交通领域中空间节点、边以及它们之间的空间相关性是非常复杂的。

在面对不同的交通网络的时候,可以采取不同的形式化描述方式。比如,对于城市区域的人口密度、车辆密度、交通拥堵状态等数据,我们可以用热力图做形式化描述。当采用热力图做分析时,由于其空间是连续的,通常会采用一些方法来做分割,例如进行栅格分割获得比较规则的栅格数据。而在另外一些情况下,比如公路、铁路或者航线网络,天然就是一种图结构,很适合使用图来描述这些交通网络的空间结构。

还有一些交通数据是由具体的用户或者交通对象,比方说人、车辆或者某些传感器,在运动过程中产生的轨迹数据。轨迹数据在空间维度上看,是由节点之间的转移关系,形成的路径或者轨迹。

如果把刚才列举的这些空间栅格、空间图和空间轨迹,再加上时间轴,就会形成不同类型的时空交通数据。那么为什么要分出时空栅格数据、时空图数据和时空轨迹数据呢?因为不同的数据类型要做预测,需要采用不同的方法。例如时空栅格数据是比较规则的欧氏数据,欧氏数据可以通过基于矩阵或者张量的方法进行描述。但是对于节点之间的关系不规则的时空图数据,它是一种非欧氏数据,那就需要一些基于图的方法表示和预测。对于时空轨迹数据,是在时空维度上的序列数据,这可以采用基于序列的方法来做预测。接下来介绍一些我们在时空网格数据和时空图数据方面做的一些工作,最后简单介绍一下我们跟交通领域的一些单位或企业合作过程中的一些实际应用场景。

总体上来看,时空交通数据预测过程中面临着一些比较共性的挑战。首先,交通数据可以看成时间序列数据,时间序列数据存在时间序列性,包括邻近性、周期性、趋势性等。所谓临近性,就是交通数据一般不会突变(除非发生偶然事件),例如早晚高峰的堵车,这是一个逐渐变化的过程,不会突然跟上一时刻相比发生断崖式的变化。还有一定的周期性,比如天周期性,周周期性还有节假日的特有周期性等,此外还有整体上的趋势性。时空交通数据在空间维度上存在异质性,也就是说,不同的区域或者位置的交通模式是不一样的。以堵车为例,比如北京的双清路的堵法和西直门的堵法是不一样的。最后从时间和空间两个维度来看,交通网络既在时间维度有相关性,在空间维度上也有相关性,同时这两个维度混合在一块叫时空相关性。要做交通数据的预测,就是要去考虑这些时间序列性,空间的异质性和时空相关性这些特质,怎么在模型中同时捕获这些性质。

二、时空交通数据预测

2.1

时空栅格数据预测

时空栅格数据预测的主要挑战主要是怎么样同时去捕获栅格数据的时空相关性,即在某一个时刻,某一个地点它的交通量跟它的邻近节点是有相关性的。另外,前一时刻各种不同的节点对当前时刻的某个节点之间也是有相关性的。更远一点的时间点,它的交通量对于当前时刻的交通量也都可能存在一定的相关性。上图显示的结构,显然有点像一种三维的立体结构,由此我们想到,可以把计算机视觉领域的相关3D处理方法,引入时空交通数据预测。

上图是ST-3DNet (Spatio-Temporal 3D Convolutional Neural Network )  模型框架。对于时空栅格数据而言,直接采用二维卷积,或者在二维卷积的基础上加上时间维,这样形成一个假的三维卷积,也就是二维卷积的堆叠,这些方式不能真正从时间、空间维度同时捕捉数据的时空相关性。如果采用三维卷积,从空间维度上分别从经度和纬度,从时间维度上再加一个时间轴,这样是一种天然的三维结构,这样就能够把这种三维卷积引入到时空网格的预测,同时捕获时空的相关性。

基于这样一种基本的三维卷积结构,可以对它进行进一步的堆叠,形成深度的时空三维卷积网络。然后,我们再沿着时间轴形成一个很长的时空数据,再分别在时间轴上比较邻近的和比较远的地方构建这种时空三维卷积组件,最后把各个组件结果进行融合做预测。我们在模型里面,通过三维卷积捕获时空相关性,通过类似于注意力机制的结构捕获时空异质性,最后通过模型的融合来捕获周期性。这样在整个模型中就能够把时空栅格数据的各种特性都能捕获到。

本节相关论文:S. Guo, Y. Lin, S. Li, Z. Chen, H. Wan. Deep Spatial-Temporal 3D Convolutional Neural Networks for Traffic Data Forecasting. IEEE Trans. on ITS , 2019.

2.2

时空图数据预测

在我们的生活中,一些实际的场景中,不规则的数据远远要比规则数据更普遍。在这种交通网络结构上,面临的挑战同样是怎么样去对时空相关性做建模。比方说在空间维度上需要处理同一个时刻,不同的节点之间的相互影响。在时间维度上,同一个节点、同一条道路或者同一个站点,它的历史数据对未来数据会造成什么样的影响。在时空维度,一些邻近的节点,甚至相远的节点,他们对当前节点未来数据也是有一定的影响,这种影响跨越了时间和空间维度,我们怎么样建模过程中考虑它,这是我们在时空图数据预测中所面临的挑战。

大家最近也会发现,深度学习领域的图神经网络非常流行。关于图神经网络方法在交通数据领域的应用,目前也有很多的学者做了这方面的工作,我们在2019年也做了一些这样的探索。首先我们在空间维度上用图卷积的方式捕获空间相关性,在每一个时间点上,同一个时刻先用空间的图卷积捕获空间关系,捕获到空间关系之后沿着时间轴排列起来,在时间维度上采用其他方式,例如一维卷积,或者循环神经网络,或者注意力机制来从时间维度进行建模。我们当时直接采用了一维卷积来捕获时间维度的信息。也就是首先从空间维度进行图卷积,然后在时间维度进行一维卷积,这样我们就可以构建一个能捕获时空相关性的结构或模块。

上图是ASTGCN (Attention based Spatial-Temporal Graph Convolution Networks)  模型的架构。通过堆叠时空图卷积模块加深模型的深度,并且在时间轴上的不同位置建立不同的组件,比如近期组件用来捕获数据的邻近性,日周期组件和周周期组件用来捕获数据的周期性。总的来说,我们通过图卷积捕获空间相关性,通过一维标准卷积和多组件组合方式捕获时间维度的相关性,通过时空注意力机制捕获时空动态性,也就是异质性,这样我们的模型就会对整个时空图数据的各种特性有一个比较完整的建模,也在预测方面也取得了不错的效果。

本节相关论文:S. Guo, Y. Lin, N. Feng, C. Song, H. Wan. Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting. AAAI , 2019.

但是上述模型在获取时空同步依赖方面仍然是有缺陷的,它的做法是先对空间维度进行建模,然后再时间维度进行建模,这样不能同步地捕获时空依赖。因此我们对之前的方法进行了改进,建立一种局部时空子图。上图是STSGCN (Spatial-Temporal Synchronous Graph Convolutional Networks)  模型架构。时空子图同时囊括了当前时刻、前一时刻和后一时刻共三个时刻的局部图结构,在这个图结构上构建一个新的局部时空子图的邻接矩阵。在这样新的邻接矩阵上做图卷积操作,我们就得到一种新的时空同步图卷积网络结构,这个模型也进一步提升了时空图数据的预测性能。

本节相关论文:C. Song, Y. Lin, S. Guo, H. Wan. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting. AAAI, 2020.

三、时空交通数据预测应用实例

最后给大家分享几个我们在时空交通数据研究过程中的应用实例。

我们跟一家航空公司合作,把时空图数据的预测模型应用于航班的需求预测。我们知道,一个航班在离起飞时间很早之前,会提前好几个月就开始售票,人们开始订票,整个过程中需求是有起伏的。因为航空公司之间面临着激烈的竞争,民航市场价格也是相对开放的,航空公司会有收益管理员负责航班的定价和放舱。什么时候该放舱,也就是把产品摆到货架上,什么时候该涨价或者打折,以前都是依靠收益管理员的经验,如果对航班需求变化曲线有一个比较准确的预测,就可以辅助收益管理员进行收益管理的相关决策。

这是时空数据预测在高速公路上的一则应用。广东的虎门大桥非常拥堵,于是建了虎门二桥,也就是南沙大桥,但是虎门二桥改怎么收费需要做出决策。收多了民众不满意,就不走这儿过了,起不到分流的作用,收少了又收不回成本,在这样需求的情况下,我们通过对道路上车辆流量进行预测,并且对不同收费标准下的车流量进行仿真,最终给出一个合理的建议。

另外,我们还跟滴滴合作,也做了一些探索。对于滴滴而言,通过用户的历史打车记录,能否预测出用户在未来一两天、两三天之内,某一个时间段范围内是不是存在某些OD(出发地-目的地对)的出行需求。这种预测主要为了促进共享出行,比如拼车的推荐,以及针对性营销,比如优惠券的精准发放。如果能够进行准确的OD预测,就可以把这个业务做得更好。

另外,我们还尝试跟阿里菜鸟也了一些合作研究,去预测快递员在揽件或者派件过程中的路径。不同的快递员有不同的做法,有的很有经验,有的是新手,做路径预测可以给后台的订单分配提供依据。比方说新来一个订单,如果这个订单正好在某个快递员的揽收路径上,那么把这个新订单分配给这个快递员可能就比较合理,这样从时间上和成本上就会得到改善。

总的来说,我感觉时空数据挖掘在智慧交通领域的应用前景非常广阔,值得我们去进行更多的探索。

整理:闫昊

审稿:万怀宇

排版:田雨晴

本周直播预告:

AI Time欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,*的平台需要*的你,请将简历等信息发至@!

微信联系:AITIME_HY

 

AI Time是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

更多资讯请扫码关注

(点击“阅读原文”查看直播回放)