2023 KDD
1 背景
-
时空图数据,无论是交通数据,还是空气质量数据,气候数据。在理想情况下,这些数据应该是细粒度的。
-
但由于高昂的成本,在某一地区部署和维护足够多的传感器往往是不现实的
-
——>因此,许多应用不得不依赖稀疏的数据,导致次优的解决方案
-
——>如何在没有传感器的区域近似数据成为了一个亟待解决的问题
- 论文研究了时空外推问题
- 估计一个函数,基于周围的上下文节点和相关的外生协变量,在图结构中预测目标区域的时空数据
- 利用来自上下文传感器的空气质量指数来推断目标位置的指数,同时考虑诸如天气条件等也会影响空气质量的协变量。
2 神经网络的不足
- 论文一个关键的属性是时空相关性
- 这个问题中使用神经网络有两个主要的局限性
- 缺乏估计不确定性的能力
- 传感器通常会产生不同程度的模糊信号,如由于网络中断等不可预见因素导致的噪声或缺失观测
- 明确捕捉这些不确定性已被证明对做出可靠决策大有裨益
- 然而,大多数神经网络是确定性的,无法处理这些不确定性。
- 对新数据的泛化能力有限
- 神经网络需要大量的训练数据来参数化一个函数
- 然而,它们对参数的依赖性限制了在不可预测的现实环境中的适应性,因为每当环境变化时,模型需要重新训练
- 缺乏估计不确定性的能力
- 这个问题中使用神经网络有两个主要的局限性
3 高斯过程和神经过程的不足
- 神经网络的这些局限性促使研究人员从概率模型中汲取灵感
- 高斯过程(GPs)是一个潜在的方法,通过各种核函数来建模时空关系
- 然而,高斯过程的核表达能力有限,这可能成为一个不利因素
- ——>神经过程(NPs)作为一种有前途的方法出现。
- NPs 通过参数化神经网络来学习构建随机过程,其中引入了聚合器来整合上下文
- 不幸的是,神经过程(NPs)无法直接应用于时空图数据
- 它们难以有效地学习时间依赖性(转换崩溃,可能会阻碍对长序列的学习)
- 它们无法在图中建模空间关系
- 高斯过程(GPs)是一个潜在的方法,通过各种核函数来建模时空关系
4 论文思路
- 提出了用于时空外推的时空图神经过程(STGNP)
- 第一个阶段利用确定性网络来学习节点的时空表示
- 不依赖递归结构,而是通过堆叠卷积层的方式自下而上地建模时间动态 ,同时通过跨集合图神经网络捕捉空间关系
- 在第二阶段,我们通过状态转换自上而下地聚合目标节点的隐变量
- 第一个阶段利用确定性网络来学习节点的时空表示