第2章
基于2D图卷积神经网络的时空相关性建模
本章在道路交通状态时空序列预测相关前沿研究中选择了有代表性的基于2D图卷积神经网络进行时空相关性建模的若干研究进行详细阐述。2D图卷积神经网络,也就是常规的卷积神经网络(Convolutional Neural Network,CNN)。
2D CNN的本质是在做一个image中某个目标像素点及其周边一定邻域范围内像素点的加权信息聚合,并将聚合后的信息作为该目标像素点的新特征。要将2D CNN用于道路交通状态时空序列预测问题的研究之中,首先要有适合2D CNN操作的类似image的数据才可以。如图2-1所示,在网格化的道路交通状态时空序列预测问题中,输入的原始特征为一个交通状态切片时间序列所形成的张量(tensor),即。对于任意一个交通状态切片,由于网格化的划分,均可以将其视为一张image,每个网格单元就相当于image的像素点,F个观测特征就相当于image的F个通道(channel)。当然,更进一步,可以将所有时段的交通状态切片全部集成(aggregate)在一起,从而构成一幅具有更多channel的大image。
如果在单个时段的交通状态切片上进行2D CNN操作,那么对于每个像素点(网格单元)而言,相当于是在同一个时段内,做其一定邻域范围内(范围大小取决于卷积核的大小)的空间信息聚合,然后生成它的新特征。这种操作,显然暗合了预测所需要的空间相关性建模,也就是说某个目标网格单元的交通状态是受到其周围一定范围内网格单元交通状态的影响的,这种影响具体反映在建模上,就是通过加权聚合生成目标网格单元的新特征。
图2-1 不同时段交通状态切片的“集成”
如果在集成后的大image上进行2D CNN操作,那么对于每个像素点网格而言,不仅聚合了同一时段空间上与它相邻(卷积核大小范围内)的网格单元的交通状态信息,同时聚合了全部时间跨度上相邻网格单元的交通状态信息,也就是同时考虑了时间和空间的相关性。这种操作方式,把时间相关性的建模,通过恰当的输入数据转换(也就是对输入交通状态切片tensor的aggregate),完全转化为卷积操作所擅长的空间相关性建模。这就是本章所要阐述的时空相关性建模思路。
下面将选择一些有代表性的前沿研究进行详细介绍。值得一提的是,以下选取的研究文献均来自同一个研究团队:郑宇、张钧波的京东研究团队。两位研究学者目前均供职于京东集团,郑宇研究员也是城市计算的最早提出者之一,他们的研究团队近年来在时空数据挖掘领域做了大量的前沿研究,感兴趣的读者可以系统地研读一下他们的相关研究文献。