英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
基于注意力的时空图卷积网络的交通流预测
概述
交通流量的预测对交通领域的研究人员和从业人员是至关重要的。然而,交通流量预测是非常具有挑战性的,因为交通流通常表现出高度的非线性和复杂的模式。现有的大多数交通预测方法缺乏对交通数据动态时空性建模的能力,因此无法获得令人满意的预测结果。在本文中,门体处理一种基于注意力机制的新型时空图卷积网络模型(ASTGCN)模型来解决交通流量预测问题。ASTGCN主要由三个独立的组件组成,分别模拟着交通流量的三个时间属性,即最近,每日和每周的依存关系。。更具体地说,每个组成部分包含两个主要部分:1)时空注意力机制,它用来有效地捕获交通数据中的动态时空相关性; 2)时空卷积,它同时使用图卷积来捕获空间模式,并使用通用标准卷积来描述时间特征。对这三个成分的输出进行加权融合,以生成最终的预测结果。实验基于来自加州运输性能评价系统(PeMS)的两个真实案例,并且实验表明所提出ASTGCN模型优于最新的基线。
介绍
近年来,许多国家致力于大力发展智能交通系统(ITS)(Zhang等人,2011年),以帮助进行有效的交通管理。交通预测是ITS不可或缺的部分,尤其是在交通流量大,行驶速度快的高速公路上。由于高速公路相对封闭,一旦发生交通事故,将严重影响交通能力。交通流量是反映高速公路状况的一项基本措施。如果能够提前准确地预测交通运输情况,交通管理部门将能够更合理地引导车辆,从而提高公路网的运行效率。
交通流量预测是时空数据预测的典型问题。交通数据被记录在固定时间点和分布在连续空间中的固定位置。显然,在相邻位置和时间戳上进行的观察不是独立的,而是彼此动态相关。因此,解决此类问题的关键是有效地提取数据的时空相关性。图1展示了时空相关性的交通流量(也可以是车辆速度,车道占用率等)。两点之间的粗线表示它们的相互影响力。线条的颜色越深,影响越大。在空间维度上(图1(a)),我们可以发现,不同的位置对A的影响不同,甚至相同的位置也会随着时间的流逝而对A产生不同的影响。在时间维度上(图1(b)),在不同的时间,不同地点的历史观测对A的交通状态产生不同的影响。最后,公路网交通数据的相关性在空间维度和时间维度上都表现出强大的动态。如何探索非线性和复杂的时空数据以发现其固有的时空模式并进行准确的交通流量预测是一个非常具有挑战性的问题。
图1:交通流量时空相关图
幸运的是,随着交通运输业的发展,高速公路上已经部署了许多摄像头,传感器和其他信息收集设备。每个设备放置在唯一的地理空间位置,不断生成有关交通的时间序列数据。这些设备已积累了大量具有地理信息的丰富交通时间序列数据,为交通预测提供了坚实的数据基础。许多研究人员已经竭尽全力解决了这些问题。早期,时间序列分析模型被用于交通预测问题。然而,在实践中让他们很难处理不稳定且非线性的数据。后来,传统的机器学习方法迅速发展,对更复杂的数据建模变得可实现,但同时考虑高维交通数据的时空相关性仍然很困难。此外,这种方法的预测性能非常依赖于特征工程,而这通常需要相应领域专家的大量研究。近年来,许多研究人员使用深度学习方法来处理高维时空数据,即采用卷积神经网络(CNN)有效地提取基于网格的数据的空间特征;图卷积神经网络(GCN)用于描述基于图的数据的空间相关性。但是,这些方法仍然无法同时对交通数据的时空特征和动态相关性进行建模。
为了解决上述挑战,我们提出了一种深度学习模型:基于注意力的时空图卷积网络(ASTGCN)预测流量在网络上的位置。该模型可以直接在原始的基于图的流量网络上处理流量数据,并有效地捕获动态时空特征。本文的主要贡献概括如下:
bull;我们开发了一种时空注意机制,以学习交通数据的动态时空相关性。具体而言,空间注意力被用于对不同位置之间的复杂空间相关性进行建模。施加时间注意以捕获不同时间之间的动态时间相关性。
bull;设计了一种新颖的时空卷积模块,用于对交通数据的时空相关性进行建模。它由用于从原始的基于图的交通网络结构捕获空间特征的图卷积和用于描述来自附近时间片的依存关系的时间维卷积组成。
bull;在真实世界的高速公路交通数据集上进行了广泛的实验,这些数据证明了我们的模型达到了与现有基线相比更佳的预测性能。
相关工作
交通预测 经过多年的不断研究和实践,交通预测研究取得了许多成就。用于交通量预测的统计模型包括HA,ARIMA(Williams和Hoel,2003年),VAR(Zivot和Wang,2006年)等。这些方法要求数据满足某些假设,但交通数据过于复杂,无法满足这些假设,因此它们在实践中通常表现不佳。机器学习方法,例如KNN(Van Lint和Van Hinsbergen 2012)和
SVM(Jeong等人,2013年)可以为更复杂的数据建模,但需要仔细的特征工程建设。由于深度学习已在语音识别和图像处理等许多领域取得突破,因此越来越多的研究人员将深度学习应用于时空数据预测。Zhang等于2018年设计了一个基于残差卷积单元的ST-ResNet模型来预测人群流量。Yao等于2018年提出了一种通过整合CNN和长期短期记忆(LSTM)来同时建模时空依赖的交通量预测方法,并且进一步提出了一种用于出租车需求预测的时空动态网络,该网络可以动态学习位置之间的相似性。尽管可以通过这些模型提取交通数据的时空特征,但其局限性在于输入必须是标准2D或3D网格数据。
图的卷积 传统卷积可以有效地提取数据的局部模式,但只能应用于标准网格数据。最近,图卷积将传统的卷积推广到图结构的数据卷积。图卷积方法的两个主流是空间方法和谱方法。空间方法直接在图的节点及其相邻节点上执行卷积过滤器。因此,这种方法的核心是选择节点的邻域。 Niepert,Ahmed和Kutzkov(2016)提出了一种启发式线性方法来选择每个中心节点的邻域,这在社交网络任务中取得了良好的效果。 Li等在2018年将图卷积引入到人类动作识别任务中。本文提出了几种分区策略,将每个节点的邻域划分为不同的子集,并确保每个节点的子集数相等。频谱方法,其中通过频谱分析考虑图卷积的局部性。基于Brunaetal(2014)提出的拉普拉斯矩阵的通用图卷积框架,然后Defferrard,Bresson和Vandergheynst(2016)使用Chebyshev多项式逼近优化该方法以实现特征值分解。 Yu,Yin和Zhu(2018)基于此方法提出了一种用于交通预测的门控图卷积网络,但该模型并未考虑交通数据的动态时空相关性。、
注意力机制 最近,注意力机制已广泛用于各种任务,例如自然语言处理,图像分析和语音识别。注意机制的目标是从所有输入中选择对当前任务相对重要的信息。Xu等人(2015)在图像描述任务中提出了两种注意力机制,并采用可视化方法直观展示了注意力机制的效果。对于图的节点分类,Velickovic等人(2018)利用自我注意层通过神经网络处理图形结构数据,并取得最新成果。为了预测时间序列,Liangetal(2018)提出了多级注意网络,以自适应调整多个地理传感器时间序列之间的相关性。但是,由于需要为每个时间序列训练单独的模型,因此在实践中很耗时。
在上述研究的推动下,考虑交通网络的图结构和交通数据的动态时空模式,我们同时采用图形卷积和注意力机制对网络结构交通数据进行建模。
预备工作
在本研究中,我们将一个交通网络定义为一个无向图G=(V,E,a),如图2(a)所示,其中V是一组| V |=N个节点;E是一组边,表示节点之间的连通性;aisin;RNtimes;N表示图G的邻接矩阵。如图2(b)中的实线所示,交通网络G上的每个节点用相同的采样频率检测F个测量值,即,每个节点在每个时间片上生成长度为F的特征向量。
图2:(a)交通数据的时空结构,其中每个时间段的数据形成一个图表;(b)在一个节点上检测到三个测量值,未来交通流量是预测目标。这里,所有测量值都被标准化为[0,1]。
交通流预测
假设在交通网络G中每个节点上记录的第f时间序列是交通流序列,fisin;(1,hellip;,F)。我们用x c,it isin; R表 示时间t上的节点i的第四特征值,x it isin;RF表示时间t上的节点i的所有特征值。X t=(x1 t,x2 t,hellip;,xt N)Tisin; RNtimes;F表示时间t时所有节点的所有特征值。X t=(x1 t,x2 t,hellip;,xt N)Tisin;RNtimes;Ftimes;t 表示tau;时间片上所有节点的所有特征值。另外我们设置y it = x f , itisin; R表示节点i在t时刻未来的流量。Tisin;RNtimes;Tp,其中yi=(yitau; 1,yitau; 2,hellip;,yitau; Tp)表示未来交通流tau; 1的节点i。
问题。给定X,过去tau;时间片上所有交通网络节点的各种历史测量,预测未来交通流序列Y=(y1,y2,hellip;,yN)Tisin; RNtimes;Tp,其中yi=(yitau; 1,yitau; 2,hellip;,yitau; Tp)表示未来交通流tau; 1的节点i。
基于注意力机制的时空图卷积网络
图3给出了本文提出的ASTGCN模型的总体框架。它由三个独立的具有相同结构的t组件,其设计用于检查历史数据的即时、每日周期和每周类型依赖性。
图3:ASTGCN的框架。SAtt:空间注意;TAtt:时间注意GCN:图形卷积;Conv:卷积;FC:完全连接;STblock:时空块。
假设采样频率为每天q次。假设当前时间为t0,预测窗口大小为Tp。如图4所示,我们沿着时间轴截取长度Th、Td和Tw的三个时间序列段,分别作为最近、每日和每周周期分量的输入,其中Th、Td和Tw是Tp的整数倍。关于三个时间序列段的详细信息如下:
(1)最近的部分:
Xh = (Xt0minus;Th 1,Xt0minus;Th 2,...,Xt0) isin; RNtimes;Ftimes;Th,是与预测期直接相邻的历史时间序列的一段,如图4的绿色部分所示。直观地说,交通拥堵的形成和扩散是渐进的。因此,过去的交通流量不可避免地会对未来的交通流量产生影响。
(2)每日为周期的部分
Xd = (Xt0minus;(Td/Tp)lowast;q 1,...,Xt0minus;(Td/Tp)lowast;q Tp, Xt0minus;(Td/Tpminus;1)lowast;q 1,...,Xt0minus;(Td/Tpminus;1)lowast;q Tp,..., Xt0minus;q 1,...,Xt0minus;q Tp) isin; RNtimes;Ftimes;Td 如图4的红色部分所示,由过去几天与预测期在同一时间段的分段组成。由于人们的日常生活规律,交通数据可能会呈现重复的模式,如日高峰。日周期部分的目的是模拟交通数据的日周期
(3)每周为周期的部分
Xw = (Xt0minus;7lowast;(Tw/Tp)lowast;q 1,..., Xt0minus;7lowast;(Tw/Tp)lowast;q Tp, Xt0minus;7lowast;(Tw/Tpminus;1)lowast;q 1,..., Xt0minus;7lowast;(Tw/Tpminus;1)lowast;q Tp,..., Xt0minus;7lowast;q 1,...,Xt0minus;7lowast;q Tp) isin; RFtimes;Ntimes;Tw由过去几周的分段组成,这些分段具有与预测期相同的周属性和时间间隔,如图4的蓝色部分所示。通常,周一的交通模式与历史上周一的交通模式有一定的相似性,但可能与周末的交通模式大不相同。因此,周周期分量旨在捕捉交通数据中的每周周期特征。
图4:构造输入时间序列段的一个例子(假设预测窗口的大小为1小时,Th、Td和Tw是Tp的两倍)。
这三个组件共享相同的网络结构,每个组件都由几个时空块和一个完全连接的层组成。在每个时空块中有一个时空注意模块和一个时空
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[235509],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。