论文略读:Graph Neural Processes for Spatio-Temporal Extrapolation

时间:2024-10-20 21:28:26

2023 KDD

1 背景

  • 时空图数据,无论是交通数据,还是空气质量数据,气候数据。在理想情况下,这些数据应该是细粒度的。

  • 但由于高昂的成本,在某一地区部署和维护足够多的传感器往往是不现实的

  • ——>因此,许多应用不得不依赖稀疏的数据,导致次优的解决方案

  • ——>如何在没有传感器的区域近似数据成为了一个亟待解决的问题

  • 论文研究了时空外推问题
    • 估计一个函数,基于周围的上下文节点和相关的外生协变量,在图结构中预测目标区域的时空数据
    • 利用来自上下文传感器的空气质量指数来推断目标位置的指数,同时考虑诸如天气条件等也会影响空气质量的协变量。

2 神经网络的不足

  • 论文一个关键的属性是时空相关性
    • 这个问题中使用神经网络有两个主要的局限性
      • 缺乏估计不确定性的能力
        • 传感器通常会产生不同程度的模糊信号,如由于网络中断等不可预见因素导致的噪声或缺失观测
        • 明确捕捉这些不确定性已被证明对做出可靠决策大有裨益
        • 然而,大多数神经网络是确定性的,无法处理这些不确定性。
      • 对新数据的泛化能力有限
        • 神经网络需要大量的训练数据来参数化一个函数
        • 然而,它们对参数的依赖性限制了在不可预测的现实环境中的适应性,因为每当环境变化时,模型需要重新训练

3 高斯过程和神经过程的不足

  • 神经网络的这些局限性促使研究人员从概率模型中汲取灵感
    • 高斯过程(GPs)是一个潜在的方法,通过各种核函数来建模时空关系
      • 然而,高斯过程的核表达能力有限,这可能成为一个不利因素
    • ——>神经过程(NPs)作为一种有前途的方法出现。
      • NPs 通过参数化神经网络来学习构建随机过程,其中引入了聚合器来整合上下文
      • 不幸的是,神经过程(NPs)无法直接应用于时空图数据
        • 它们难以有效地学习时间依赖性(转换崩溃,可能会阻碍对长序列的学习)
        • 它们无法在图中建模空间关系

4 论文思路

  • 提出了用于时空外推的时空图神经过程(STGNP)
    • 第一个阶段利用确定性网络来学习节点的时空表示
      • 不依赖递归结构,而是通过堆叠卷积层的方式自下而上地建模时间动态 ,同时通过跨集合图神经网络捕捉空间关系
    • 在第二阶段,我们通过状态转换自上而下地聚合目标节点的隐变量