基于混合深层学习框架交通流预测外文翻译资料

 2022-07-31 21:31:21

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


基于混合深层学习框架交通流预测

摘要

交通流量预测是智能交通管理领域的一个关键问题。在这项工作中,我们提出了短期交通流预测的混合深度学习的框架。它是由多层融合深度学习所构建并且结合共同学习的时空特征。根据交通流数据的高度非线性的和非固定的特点,框架由循环神经网络(RNNs)和卷积神经网络(CNNs)组成。前者通过使用长短期记忆(LSTM)单单元来捕获长的时间依赖性,而后者捕获实时的走向特征。本文提出的框架与其他传统的浅度和深度的学习模型将基于PeMS的数据集来进行交通流预测比较。实验结果表明,混合框架能够处理复杂的非线性城市交通流预测并且满足准确性和有效性的。

关键词:交通流预测;深度学习;长短期记忆;卷积神经网络

一.引言

随着车辆的快速增长和城市化,交通拥堵已经成为一个全球性的大问题[1]。它加剧了污染排放,导致路网的效率比较低。在城市地区预测交通流量的研究因此变得至关重要,它一直被视为智能交通管理中最重要的问题,因为它可以导致有效的交通管制指导的科学决策。在过去的几十年,交通瓶颈和交通流预测的概念已在许多研究中被提出。从文献中看出,对交通流预测两种主要的方法被定义为:基于模型的方法和数据驱动方法。基于模型的方法包括经典浅度学习像时间序列的自回归统计算法(ARIMA)[2],k最近邻算法。[3],贝叶斯网络[4],和支持向量回归(SVR)[5]等。因为交通流预测在很大程度上依赖于从各种传感器和相关的数据采集设备,诸如照相机,感应线圈,雷达等收集的历史数据。随着物联网和利用交通传感器数据采集技术的发展,交通大数据的时代已经来临。浅度模型不能很好地适应新的条件下,致使交通流预测需要数据驱动模型的支持。最具代表性的数据驱动方法是神经网络和深度学习[6-8],它可以自动提取相关的交通流数据高级特征。

近日,深度学习已被证实在许多领域是成功的,如图像,音频和语言学习任务[9],它采用多层体系结构或深的架构捕捉来自多个级别数据的深层特征。对于交通拥堵的分析和交通流预测,虽然传统上浅度机器学习方法被普遍应用,但是深度学习方法也引起了巨大的研究的兴趣[8,10]。基于递归神经网络(RNN)的变体,长短期记忆网络(LSTM)可以被用于捕获时间序列数据[11]的长依赖性特征。另外,卷积神经网络(CNN)可以提取图案,例如全市范围内的人群拥堵,并且可以用来学习拥堵是如何演变的[12]。因此,在交通流量预测问题上,非常需要开发一种混合深度学习框架模拟时间序列的各种隐藏的特征和长期依赖性。

本文提出了一种基于深度学习模型的新交通流预测框架,它注重局部空间特性和长期依赖特性和时空相关性对交通流数的据影响。总之,这项工作旨在提高在一些重要方面的分层和融合深度学习架构性能,使其在处理交通流数据的时间和空间特征更加强大和灵活。它也显示出了提出的混合深度学习框架可以改善交通流预测的精度和通用性。实验结果表明,我们提出的框架在交通流预测中正取得信任。

本文的结构如下:第二节介绍了相关工作。第三节总结混合深度学习建筑的主要特点。提出的交通流预测框架设计还在过渡阶段,包括如何扩展和整合基本深度学习模型并集成到提出的框架。第四节提出使用PEMS流量数据集实证研究和评估了该方法的性能。最后一节提供了结论和今后的研究指导。

Ⅱ.相关工作

由于交通数据的动态和非线性特征,越来越多的研究人员开始关注统计学机器学习模型在交通流预测领域的应用。在过去的几十年里,大量的交通流预测方法已被开发,以帮助智能交通管理和控制,从而提高交通网络效率,如差分整合移动平均自回归模型[2] 。哈米德等人,用ARIMA模型来预测城市干道[13]的流量。 Chang等,提出了一种基于KNN非参数回归[14]的动态多间隔交通预测模型。 Vlahogianni等人,提出了优化的人工神经网络模型[15]预测交通流。郑某等人,提出在线学习加权支持向量回归模型用于短期交通流预测[16]。

传统的神经网络也已被广泛应用,并显示在交通模式识别中特别成功。陈和格兰特 - 穆勒提出了基于浅度神经网络方法的流量应用[17]。Karlaftis和Vlahogianni提供以前开发的关于交通模式识别[18]的方法概述。混合神经网络,它结合了各种神经网络的优势,在计算机视觉领域越来越受欢迎,如图像字幕和图像分类,但这种混合式架构没有很好的运用在交通流预测的研究中。我们的方法提供了先前的时间序列模型和传统的状态空间模型的交通流预测的替代品。该方法是捕捉在实时趋势和由于诸如交通速度,天气和交通事故情况引起的长期依赖关系交通模式中的非线性时空效应。此外,我们的方法侧重于局部空间和较长时间的特点和发现时空相关性交通流数据的影响。

三.方法

A.问题定义

交通流预测一直是智能交通管理领域的一个难题。它的目标是在一定的时间间隔内预测在观测点的车辆数量(如交叉路口或站)。时间间隔通常设定为从5到30分钟。表示第个时间间隔的第个观察点处的交通流量(例如路口或站)。在时间时刻,交通流预测的任务是基于历史流量序列预测在时刻交通流量或在时刻交通流量,其中是该组所有观察点。

对于交通流预测的问题,如何处理时空数据的特征是关键。由于历史的局部空间特征的顺序描述的是上下文的时间序列信息,它自然会影响下面的趋势演变(参见图1,我们称之为局部趋势)。也就是说,附近的流量数据点之间通常有相互密切的关系。然后我们使用CNN捕捉交通流数据的实时的趋势特点和尺度不变特征。在另一方面,我们用LSTM来捕获交通流数据的长的时间依赖性和规律性特征。

图1.时间序列的实时走势和长期时间的依赖

  1. 混合深度学习框架概述

交通流预测是在非自由流动的由于快速变化的交通条件情况下(例如,高峰时段,事件,工作区,等)[1]的挑战。该交通流量数据总是高度非线性的和非固定的,这是由不同的交通条件下不同的部件的影响。在本节中,我们基于混合深度学习交通流预测框架(HDTF的简称)描述CNNLSTM。它是由CNN和LSTM神经网络的组合,它参考交通流数据的空间 - 时间相关性的特征来实行。图2是我们的提出的混合深度学习框架的图形说明。很显然,从图2,我们的框架由一维卷积神经网络,LSTM RNNs和特征融合层(它简单地串接不同特征)组成。 CNN是用来捕捉交通流数据的实时走势特征,LSTM是用来学习短期时间变化和长期依赖周期性的特点。然后,我们把这些时空特性融合进特征级的基础层。最后,我们把那些空间 - 时间特征融入预测的回归层。

  1. CNN用于实时走势的学习

CNN是一种前馈神经网络。它的人工神经响应覆盖周围的区域单元,这在图像处理中有着杰出的表现。对于传统的CNN,它被分为几个阶段,其中每一个含有三个级联层(卷积,活化和汇集层)[19]。

考虑到交通流数据的时移特性,我们采用CNN对实时走势进行卷积和联合操作,它可以保存的时间序列的空间和时间局部性。 CNN主要出于实时趋势的考虑,并对混合深度学习框架提供更加融合的特点。

图2一个混合交通流量预测图深度学习框架(HDTF的简称)

我们简要回顾一下这三个层次的流程如下:

在这些方程,方程(1)是卷积运算,方程(2)代表的激活函数,方程(3)表示汇集层中使用的功能。 和分别表示卷积层输入和输出,超脚本表示所涉及的层。和分别表示激活层的输入和输出。此外,因为其良好的通用性和快速收敛能力深度学习模型[21],我们用最大池和RELU激活功能作为超参数。

  1. LSTM长期依赖性学习

LSTM网络是通过Hochreiter和施米德休伯[11]提出的一种特殊的RNN架构,其能够学习长期依赖性并且即使在嘈杂的,不可压缩的输入序列的情况下,桥接的时间间隔超过1000个步骤。 LSTM网络引入了一个新的结构被称为存储器单元(参见图3)。每一存储器单元包含四个主要因素:输入门,忘记栅极,输出门和具有一个自复发的神经元。这些门使模块在很长一段时间保持并访问信息。

由长时间依赖性学习模块LSTM通过一组方程计算的隐藏状态如下:

图3. LSTM单元块,Christopher Olah可视化的想法[23]

在这些等式中,,,和分别表示输入门,忘记栅极,输出门和自复发。输入表明有多少新的信息将通过存储单元。忘记门负责多少信息应该被记住。输出门决定多少的信息将被传递到下一门并且输出。是一个等于RNN的自复发的神经元。是存储单元的内部存储器由通过忘记栅极的先前的内部存储器状态elementwise乘法和自我复发状态元素方式乘法的总和。最后,表示隐藏状态,这可以通过与输出门内部存储器的elementwise乘法来计算。

四实验

在本节中,我们使用了从加州高速公路性能测试系统衍生的交通流实验数据(PEMS)[20],以评估所提出的方法。我们开展对浅层和深层的学习模式,对比实验来证明我们的混合深度学习框架的预测效果。

  1. 数据集

我们的实验使用PEMS数据集。在本文中所用的特殊的数据集的时间段是从02/01/2013到29/08/2013。在聚集原交通流数据到无重叠的5分钟间隔后实验数据集变得平滑化,并且一个探测器每天保持测试288个数据点。我们的实验数据集有69020个数据点。我们用前80%的数据点来训练所有模型,剩下的20%的数据点被用作测试数据。

  1. 实验装置

所有的实验是由PC服务器(英特尔(R)至强(R)CPU E5-2623 3.00GHz,存储器128GB,GPU:4 * 12G NVIDIA特斯拉K80C)执行。本文提出的框架与几大主流交通流预测方法相比。实验测试比较包括下列算法:ARIMA模型,SV-RBF与径向基核,SV-POLY与聚内核,SVR-LINEAR与线性核,RNN,LSTM和GRU(门控经常性单位)。在我们的框架的输出(参见图2),我们使用线性函数作为最后的活化。此外,我们使用了最小 - 最大归一化方法来缩放输入业务流数据到[0,1]。

在这里,我们描述这些模型的实验细节和参数设置。在Python库,包括Tensorflow和Keras,用于构建我们的模型。深度学习方法(包括RNN,LSTM,GRU和我们提出的混合深度学习框架HDTF)的参数通过使用与Keras默认参数的均匀分布来初始化。在深度神经网络中有许多参数,这使得它容易过度拟合。我们采取几种措施来解决这个问题。有0.2概率的误差被使用在所有完全连接层中,批量大小为512。并且我们使用已经证明在训练卷积网络和多层神经网络[22]中能达到快速的收敛速度的亚当优化器。该HDTF模型通过优化均方误差损失进行训练。此外,我们选择所有交通流量数据的80%进行训练,其余20%被选为测试。通过训练集的交叉验证,选择正则化惩罚参数(C)和RBF核的标准偏差的倒数惩罚参数进行网格搜索SVR训练。

均方根误差(RMSE)评估我们的实验结果。该公式如下:

其中和分别是预测值和地面实况,是所有预测值的数量。

  1. 结果与讨论

表1给出ARIMA,SVR(不同的内核),RNN,LSTM,GRU和我们的HDTF方法的定量结果。研究发现,HDFF实现比预测精度和空间分布上其他方法更好的性能。其原因是,我们的方法充分利用实时走势分布,短期时间上的变化和长期依赖。这验证了我们的混合深度学习框架可以通过利用CNN和LSTM双方捕获的信息来提高性能。

表格1.比较不同模型的RMSE值

模型

RMSE

SV-RBF

0.040

SV-POLY

0.097

SVR-LINEAR

0.037

ARIMA

0.052

RNN

0.038

LSTM

0.030

GRU

0.031

HDTF(本文采用的模型)

0.028

我们可以使用历史观测(其长度被称为窗口大小或查找大小)来预测在随后的时间间隔中交通流。从表2中,我们观察到,相比于RNN,GRU和LSTM,我们的方法HDTF在跨不同的查找大小时对预测的误差最低。CNN需要输入足够的数据点到卷积并且不能分别工作在3和5的尺寸上。随着查找尺寸的增加,这些模型的预测误差减小或接近稳定。当查找大小为20,这些对比模型的RMSE达到最小。当查找规模的不断增加,RMSE保持稳定或增加。

图4是不同深度学习模型和不同学习历元的RMSE曲线(包括RNN,LSTM,GRU和HDTF),其表示当历元大小小于40该RMSE略微在降低(除了GRU).这部分是因为输入数据被归一化。当历元大小是40,达到最低值,并且当该尺寸继续增加,RMSE几乎保持稳定。也就是说,不是历元越高预测性能越好。

当训练时期的数量太大,该模型将过度拟合。在另一方面,大量的训练历元将导致极大的计算成本。虽然它可以提高模型训练的精度,但这是不利于模型的应用

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[241435],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。