LSTM网络:一种基于深度学习的短期交通流量预测方法外文翻译资料

 2022-07-31 21:12:47

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


LSTM网络:一种基于深度学习的短期交通流量预测方法

摘要:

短期交通预测是智能交通系统的核心问题之一。准确的预测结果可以促使通勤者选择合适的出行方式、出行路线和出发时间,对交通管理具有重要意义。为了提高预测精度,一种可行的方式是开发有效的交通数据分析方法。近年来涌现了丰富的交通数据和计算能力,这促使我们通过深度学习的方法来提高短期交通预测的准确性。提出了一种基于长短时记忆(LSTM)网络的流量预测模型。与传统的预测模型不同,LSTM网络通过一个由多个记忆单元组成的二维网络来考虑交通系统的时空相关性。通过与其他典型预测模型的比较,验证了所提出的LSTM网络具有较好的性能。.

一. 介绍

随着社会经济的发展,大城市的车辆数量急剧增加,现有的道路网络容量已无法容纳较多的车辆。为了缓解交通拥挤的状况,可以考虑两种方法。一是通过增加现有道路的车道数来扩大路网的总容量。然而,这需要额外的土地和大量的基础设施支出,而这些往往在许多城市地区是不可行的。另一种方法是运用各种交通控制策略,有效利用现有的道路网络。这种方法不需要太多的开支,在大多数情况下是可行的,因此在现实中更实用。控制策略往往涉及短期交通预测技术,预测潜在的交通拥堵,诱导人们选择更合适的出行路线,从而缓解交通拥堵。因此,准确的短期交通预测对于交通控制至关重要,成为智能交通系统不可或缺的一部分。

不同于传统交通预测,短期流量预测只预测未来时间的交通流,其中从几分钟到几十分钟不等。由于基础设施的限制,早期的研究缺乏实时交通信息获取的检测设备,短期交通预测仅仅依赖于有限的历史交通数据。因此,与实际交通数据相比,预测结果往往存在明显的偏差。如果能够及时获取包括交通量、车速、道路养护、交通控制等在内的更多实时交通信息,预测结果将更加可靠。幸运的是,随着交通基础设施和数据传输技术的进步,一个交通信息网络正在形成,它可以实时监控各种交通信息,现在可以很容易地获取大量的交通数据。这些庞大的交通数据有助于更准确的交通预测。因此,如何利用海量交通数据提高预测精度成为近年来的研究热点[1-3]

在过去的几十年里,许多数据分析模型被提出来解决短期交通预测,包括历史平均和平滑[4,5],统计和回归方法[6,7],基于交通流理论的方法[8,9]和机器学习技术[10,11]。这些预测方法可分为两类,即参数方法和非参数方法。在参数化方法中,自回归综合移动平均(ARIMA)模型是一种被广泛认可的交通预测模型框架。在过去的几十年里,人们已经完成了许多与ARIMA相关的工作。早在20世纪70年代,Levin和Tsao就应用BoxJenkins时间序列分析来预测高速公路的交通流,他们发现ARIMA(0,1,1)模型是最具统计意义的[12]。同一时期,Hamed等人将ARIMA模型应用于城市主干道[13]的交通流量预测。其他一些改进的方法如Kohonen-ARIMA、子集ARIMA和向量自回归ARIMA也被用于短期交通预测[14-16]。ARIMA在理论和实践上都被证明是有效的,并逐渐成为新开发的预测模型比较的基准。交通流量呈现规律性变化时,参数化方法可以获得较好的预测效果,但交通流量呈现非规律性变化时,参数化方法的预测误差较大。为了解决这一问题,交通流预测领域的非参数方法也备受关注,如非参数回归[17]、神经网络预测[18]、支持向量机(SVM)[19]、卡曼滤波[20-21]以及这些算法的组合[22-27]。Li和Liu提出了一种改进的基于改进粒子群优化算法[28]的预测方法。Kuang和Huang建立了径向基函数(RBF)神经网络预测模型[29]。Li等人建立了短期交通流量预测[30]的组合预测模型。Wang等人提出了一种改进的贝叶斯组合模型[31]。Xie等人提出了短时流量预测[32]的小波网络模型。综上所述,为了满足ITS中日益增长的对实时交通流信息的需求,已经开发了大量的交通流预测算法,这些算法涉及不同学科[33]的各种技术。

近年来,在现有的道路网络上部署了大量的交通传感器,产生了大量具有高时间分辨率的交通数据。与此同时,“数据爆炸”的问题也越来越受到重视,由于维数灾难,用传统的参数方法来处理这些数据是很有挑战性的。传统的交通预测方法大多局限于在有限的数据范围内进行浅层相关搜索,而无法对交通流渗透深度相关和隐式交通信息。面对现代信息技术中海量的交通数据,传统的预测方法不能保证准确的预测。因此,迫切需要新的技术来处理深层次的大数据。

随着人工智能的发展,深度学习方法蓬勃兴起。交通预测逐渐向计算智能方法转变,基于深度学习方法的短期交通预测成为一种新的趋势。深度学习理论可以通过分布式计算解决维数问题。与传统的浅层学习结构相比,深层神经网络能够利用分布式和层次化的特征表示[35]来建模深层复杂的非线性关系。到目前为止,深度学习已经在计算机视觉、语音识别和自然语言处理领域取得了许多成功。在深度学习理论的指导下,人们提出了许多神经网络变体来辅助交通预测。典型的例子有前馈神经网络[36]、RBF神经网络[37]、频谱基神经网络[38]和递归神经网络[39]。其中,RNN被广泛认为是一种适合捕捉交通流时空演化的方法。然而,以往的研究表明,传统的神经网络不能捕捉到神经网络的长期演化,训练一个滞后5-10分钟的神经网络是困难的,因为它存在着梯度消失和爆炸梯度。为了解决这一问题,本研究将长短时记忆[40]网络应用于短时流量预测。与传统的RNNs相比,LSTM网络能够在较长的时间跨度内捕获时间序列的特征。因此,利用LSTM网络进行流量预测可以获得更好的性能。

本研究的贡献体现在三个方面。首先,提出了原始目的地相关矩阵(ODC),ODC矩阵表示路网中不同路段之间的相关关系。其次,提出了一种层叠连接的多层LSTM网络用于交通预测,该LSTM网络的两个维度直接代表了时空相关性。第三,通过全连接层和矢量发生器作为ODC矩阵的参数,在LSTM网络中为存储单元生成一个新的时间序列,这不同于目前最先进的方法。通过对比研究,验证了该预测模型的鲁棒性。

本文的其余部分组织如下。第2节介绍了现有交通预测文献的概况。第3节介绍了该方法,并从5个部分解释了所提出的LSTM网络模型的体系结构。第4节给出了基于流量数据集的实验结果,并与传统的预测方法进行了比较。结论部分是本文的结论,并对今后的工作进行了展望。

二. 相关工作

自20世纪70年代初以来,短期交通预测一直是ITS及相关研究的重要组成部分。它是基于当前和过去的交通信息,对未来几分钟到几个小时的预测。在早期,人们的兴趣主要集中在开发方法上,这些方法可以用来模拟交通特征,例如体积、密度、速度和行驶时间,然后产生预期的交通状况,这些可以被看作是典型的方法,例如元胞自动机。后来,数据驱动方法的应用成为了文献的基调,研究人员提出了各种各样的算法和预测模型,其中大部分是参数方法。随着交通数据量的增长,传统的方法在交通不规律、道路设置复杂的情况下,以及面对大量的结构化和非结构化数据集的情况下都存在不足。因此,基于智能的计算方法,包括神经网络和贝叶斯网络,模糊和进化技术,以及不同种类的深度学习方法,最近被赋予了更大的权重。

近年来,一些有代表性的研究已成功地应用于交通预测,取得了较好的效果。Huang等人提出了一种具有多任务学习[35]的深度神经网络。他的研究为交通流量预测的深度架构网络算法提供了一个批判性的回顾,并将一个多任务回归层用于无监督的特征学习。Lv等人对大数据下的交通流预测进行了综述,提出了一种深度学习方法,利用堆叠式自动编码器(SAE)模型学习通用的交通流特征,并采用贪心分层方式[41]进行训练。这两项代表性研究均采用了深度学习技术,但时空相关性不明显。自提出RNN以来,已有许多基于RNN变体的工作,其中Ma等人的代表性研究是[42]。他的研究试图将深度学习理论扩展到大规模交通网络分析中。基于真实交通数据集,采用深度受限的玻尔兹曼机和RNN结构对交通拥堵演化进行建模和预测。由于RNN在面对长期时间序列时表现出不足,LSTM自然被认为是一种改进的方法。2015年,Ma等人利用LSTM网络有效地捕获了非线性流量动态[43]。在他的研究中,LSTM网络由三层组成,其中隐含层由记忆块组成,通过适当的训练方法,LSTM网络可以自动确定最优时滞,与现有文献相比,这是一个很有前景的创新。

不同于上述的深度学习方法,本文构建了一个基于内存单元的多层级联LSTM网络,并通过全连接层和向量生成器将ODC矩阵集成到LSTM网络中。ODC矩阵包含了路网中不同路段的时空相关性,它有助于LSTM网络捕捉交通流演化特征。LSTM网络的两个维度直接的表示为时间轴和空间轴。与现有的交通预测方法相比,该方法在精度上有较好的表现,同时满足实时性要求。

三. 方法

短期交通预测是一个时空复杂性问题。下一时刻的预测结果是基于当前状态和之前的知识,其中包括目标路网之间的相互作用。本文采用层次结构处理海量的交通数据,并结合LSTM网络的时空相关特性,得到了可靠的预测结果。所提出的短期交通预测模型是基于现有的技术,包括车联网(IOVs)、相关分析(correlation analysis)、RNNs等。方法的细节将在本节中解释。

3.1车联网

充足的交通数据是准确交通预测的基础,而IOVs可以为我们提供海量的交通数据。IOVs是一个庞大的信息网络,包含车辆位置、车速、行驶路线等信息。通过全球定位系统、射频识别装置、多传感器、摄像头和互联网技术,可以及时收集交通数据的各种信息。然后根据收集到的交通信息进行数据分析。在过去的几年里,大量的交通传感器被部署在现有的道路网络上,动态交通信息可以得到很好的监测,这也同时表明了IOVs的前景。虽然IOVs还处于起步阶段,但已有的海量交通数据已经可以帮助我们做出更准确的交通预测。此外,近年来传感器的精度有了很大的提高,这也有助于短期交通预测。

3.2 时空相关性

在交通预测过程中,时空相关性是一个必须考虑的因素。时间相关性指的是当前交通流量的相关性和过去的交通流量时间跨度(时间域),而空间相关性是指目标路段的交通流量的相关性及其上游和下游路段在同一时间间隔(即空间域)。为了加强路网内的时空相关性,利用ODC矩阵来定义不同观测点之间的相关性。设目标路网中有个观测点;则ODC矩阵的大小为,可以表示为:

(1)

Cr是相关分析函数,是一个向量,它代表观察到的交通状态的时间间隔,这个向量可以用表示,观察点的交通数据时间间隔。ODC中的 表明个观测点的贡献系数观测点的时间跨度。本文将相关分析函数Cr表示为:

(2)

时间序列是第个观测点的交通数据,观测点的流量数据。结果这两个观察位置的相关系数。

可以看出,ODC矩阵随着时间的推移是动态的。观察时间和时间跨度Delta;T都将决定ODC矩阵的元素。ODC矩阵将作为LSTM网络的输入参数。

图1. RNN结构

3.3 循环神经网络

在传统的神经网络中,相邻层之间只有全连接,而层内的节点之间没有连接,这种网络在处理时空问题时可能会出现故障,因为在时空网络中节点之间总是存在相互作用。与传统网络不同的是,RNN中的隐藏单元接收到的是一个从前一状态到当前状态[44]的反馈。图1是一个基本的带有延迟线的RNN结构,在时域中展开了两个时间步长。在这种结构中,输入向量一次一个地输入到RNN中,而不是像传统的网络结构那样使用固定数量的输入向量。此外,该体系结构可以利用当前所有可用的输入信息。此外,还可以根据实际情况确定神经网络的深度。可以看出,最终的输出不仅依赖于当前的输入,还依赖于之前的隐含层的输出。图1中RNN的数学模型可以表示为:

(3)

其中xi;是输入变量、为权重矩阵, 、是偏置,sigma;和是激活函数。、和是临时变量,是预期输出。损失函数可以表示为:

(4)

其中是实际输出。因此,处的输出是处的输入与历史数据的联合函数。RNN模拟序列数据的相关性,网络的深度是时间跨度。然而,由于存在消失梯度和爆炸梯度问题,随着时间跨度的增大,RNN模型的精度下降,影响最终的输出结果。

图2.LSTM记忆单元构想

3.4 LSTM记忆单元的结构

LSTM网络是一类特殊的RNN。LSTM网络将隐层作为一

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[241460],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。