使用神经网络预测道路交通的方法外文翻译资料

 2022-12-25 14:08:35

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


神经计算和应用

神经计算和应用(1999)8:135 – 142

@1999 Springer-Verlag London Limited

使用神经网络预测道路交通的方法

R.Yasdi

GMD FIT,德国国家信息技术研究中心,人机交互部门,Sankt Augustin(圣奥古斯汀),德国。

交通控制中心日常运作和规划活动的一个重要组成部分是短期预测,即每天对未来几天交通流量的预测。这样的预测对各种高速公路上的道路交通的最优调节有很大的影响。在日益增加的道路交通问题情况下,它们越来越重要。本文针对基于时间序列数据的神经网络预测系统的有效性提出了一种新的方法。我们只使用一个参数,即预测的交通量。我们采用人工神经网络进行交通预测,应用于路段。在这个研究中,Jordan网络在时间序列模型中十分流行。仿真结果表明,这种结构的学习具有良好的泛化能力。

关键词:学习;神经网络;预测;时间序列

1.介绍

交通控制中心(TCC)是德国交通控制系统的核心。一方面,它们与数据收集系统相连;另一方面,它们用于控制可变消息符号系统,并为广播准备消息。对于交通管理而言,特别是交通信息系统方面,为了给道路使用者提供实际的出行估计时间,道路交通的预测是重要的一部分。日益增加的交通需求使得TCC的扩展成为了监控、控制和管理交通的智能工具。

根据收集的历史数据的时间序列来预测未来行为是许多科学应用中的一个重要问题。时间序列是一组时间序列,这些数据值是物理过程的度量值。在交通控制框架中,环形探测器是主要的测量源。他们主要提供关于车辆流量的信息,特别是对于交通信息系统,这些参数的预测是至关重要的组成部分。在时间tmminus;l ,... ,tmminus;2 tmminus;1,预测值可以制定为与时间的估计价值tm的知识价值相同的变量,或其他流程变量,这里 m是衡量预测地平线,l是测量时间历史的方法,充分必要代表了现象。

从传统的时间序列分析[1]到最近使用神经网络的方法[2],已经有了许多学习和预测时间序列的方法。其中一个共同的核心问题是一个模型结构的确定,它极大地影响学习和预测结果模型的性能。从一组模型中选择最小平均预测误差的模型为最佳模型。通过这种方法,他们给出了模型选择问题的方法。但是,一般来说,训练数据的平均平方误差随着模型的增大而单调减小。在另一方面,测试数据(也称为平均预测错误)的平均误差在开始时减小,但随着其大小的增加而增加。平均预测误差的增加是由于估计参数方差的增加造成的。这表明,在平均预测误差的条件下,存在一个最优模型的大小能够最大化它的概括能力。因此,平均预测误差不足以在所有候选体中找到最佳的、具有更好的概括能力的模型结构。

在时间模型中流行的Jordan神经网络[3]在本研究中得到了检验。为此,设计、训练了基于Jordan架构的神经网络,利用其过去的值来预测交通时间序列的未来值。

本研究的目的是建立一种能够产生可靠、一致和准确的交通量预测的模型。在随后的部分中,描述了这个任务的数据收集和表示方法。接下来是一个时间序列的递归神经网络模型的概述。在此基础上,给出了模型的学习和预测性能。文章最后对该方法进行了讨论,并展望了该方法的推广和未来发展方向。

2.数据陈述

2.1数据收集

通常,交通数据(体积、流量、速度、街道状况、气候条件等)都是通过道路上的感应回路来测量的,并被转发到当地的路段。当地的路段收集不同的数据单元,处理每个区域的数据集合,并将结果发送给TCC。数据由一个时间序列表示。时间序列是一组时间序列,这些数据值是物理过程的度量值。在道路交通控制框架中,环形探测器是主要的测量源。

在这项研究中,每五分钟收集一次交通流量(即通过的车辆数)[4,5]。数据是在德国国道B39上的左边线测量的。这条路绕过大众公司,因此它被大众的员工大量使用。由于数据量大,数据必须进行筛选。在5分钟的时间间隔内,数据振荡得太多,并且随机的部分是高的。因此,有必要把它们每隔10分钟或15分钟的间隔聚集起来。平均值是用三个值构建的。为了获得平滑的时间曲线,可以计算三个值的平均值。这种表示方式的主要优点是数据库中数据量的大幅减少,以及在模拟器中易于处理。

2.2数据分类

测量的当天且发生在该地区的事件都能严重影响交通。我们区分普通的日子,如星期一至星期日,以及举行足球比赛或音乐会的活动日。我们考虑六种模式:普通星期一;周二到周四;星期五;周六;周日和节假日;还有特殊的节日。目前,我们不考虑意外情况,这是未来研究的主题。图2描述了一个普通的周一,早上5点到7点之间的早晨高峰,下午不那么明显,晚上的高峰也不那么明显。早上6点和下午2点,大众汽车发生了变化。

如果我们假设类似事件的交通模式再次发生,我们可以在相同的交通条件下预测当天的交通流量。每个类都有一个具有代表性的模式,称为参考模式,该模式存储在知识库中并用于预测。天数由绝对模式表示,事件与绝对值有关。

2.3知识库

知识库包含了所有关于流量的信息和用于预测的网络。它由三部分组成:

  1. 有关道路工程的口头信息,道路通行能力的估计,以及所有可预见事件的库。
  2. 规则部分以ifhellip;thenhellip;的形式表示专业知识。在最新版本中,专业知识将由模糊规则构成。
  3. 数据库包含模式和测量值,这些基于整个周期的数据值被从0到1规范化。

为了提高预测的有效性,必须定期维护知识库。每天一次,测量的数据将被传输以提供当前模式。为了能够将其纳入知识库中,我们需要构建一个等价的历史模式,可以得到如下:根据每天发生的事件,知识库中可用的相应的历史事件模式将被更新。得到的历史模式和当前的日期必须进行比较,计算这两种模式之间的平均偏差。

3.部分递归网络

在这一节中,我们将着重训练一个递归神经网络来识别或复制一个时序的插槽。在这方面,我们首先引入部分递归网络[6],该网络通常用于序列识别和复制。这些网络基本上是反向传播网络,有适当的反馈链接。换句话说,部分递归网络的连接主要是前馈,但包括精心选择的一组反馈连接。不像时滞神经网络那样,部分递归网络的主要功能是显式地处理时间,在空间上表示时间信息。部分递归网络的递归使网络能够记住最近的线索,但并不会显著地使整个网络的结构和训练变得复杂。在大多数情况下,反馈链路的权重是固定的,因此一般的反向传播学习规则可以很容易地用于训练,这种网络也称为序列网络[7],接收反馈信号的节点称为上下文单元。在这些网络中,向前传播被假定为快速或没有参考时间,而反馈信号被锁定。因此,t时,上下文单位信号来自(t-1)时的网络状态。这样,单元还记得过去的某些方面,形成一个t时刻的上下文处理。因此,整个网络在特定时间的状态取决于之前状态的聚合以及当前输入。因此,网络可以在序列的末尾根据其状态识别序列,甚至可以通过当前的序列预测(复制)给予令牌的继承者。由于部分重复的网络基本上是一个多层前馈网络,反馈链接可以来自输出节点或隐藏层节点,反馈链接的目的地(即上下文单元)可以是输入节点,也可以是隐藏层节点。由于各种各样的可能性,有几个不同的部分回归网络模型。两个主要的模型是Jordan的顺序网络和简单的复发性网络,前者包括Jordan网络[3],后者包括Elman and buffer网络[8,9]

3.1 Jordan的连续网络

该模型的实现是将网络输出的循环链接添加到一组上下文单元Ci中,后者形成了上下文层,并从上下文单元到自己。图1显示了Jordan模型的总体结构。在这个图中,单箭头表示仅从源层的第i个节点到目标(上下文)层的第i个上下文单元的连接,而宽箭头表示通常完全连接的前馈连接,如在一般的反向传播网络中。在这样的网络中,与每个状态相关联的输出反馈给上下文单元,并与表示输入节点上的下一个状态的输入混合,整个构成了新的网络状态,以便在下一次的步骤中进行处理。

经过几个步骤的处理后,上下文单元上的模式和输入单元都是网络所遍历的状态的特定序列的特征。换句话说,上下文单元通过与单位权重的反馈链接,从上一次的步骤中复制输出节点的激活。上下文层中的自连接使上下文单元具有一些个性或惰性。该模型有一个输入,它的值是在时间t0上的最近值和一组过去的值,直到时间tl;网络的输出由t 1t m预测范围内的预测值组成。这允许一个更丰富的模型表示时间序列。

图1:Jordan网络结构

在大多数情况下,很难获得关于某一特定任务的网络结构的先验信息。这就需要尝试和错误地学习各种大小的网络,这是BP学习的主要难点之一。BP的学习在解释隐藏单元方面也有困难。这一困难是由于网络的自由度过多,以及在隐藏层上的分布式表示造成。因此,需要强调的是,没有系统的程序来寻找神经网络的最优配置(隐藏层和神经元的数量)。在第一个实验中,我们试图通过分析几个网络拓扑结构来找到一个合适的结构,每天一个网络。然后我们比较了学习算法的性能,然后使用一个网络来预测流量和准确率。最后,我们提出了一个基于反向传播训练程序的多层Jordan网络。神经网络结构由4个神经元的两个隐藏层组成,然后是一个线性神经元的输出层,而输入节点的数量设置为4个。

3.2初始化JE-Weights

Jordan-Elman-weights的初始化功能需要5个参数的规范:

  • alpha;,beta;:正向连接的权值从区间中随机选取[alpha;= 1,beta;-;
  • lambda;:从上下文到自身的自循环链接的权重。我们使用lambda;= 0;
  • gamma;:与上下文相关的其他回复链接的权重。这个值通常设置为1.0;
  • psi;:所有上下文单元的初始激活。

这些值将被设置为模拟器中的初始化参数。

3.3学习功能

通过删除部分递归网络中的所有经常性链接,一个简单的前馈网络仍然存在。上下文单元现在具有输入单元的功能,即整个网络输入由两个组件组成。第一个组件是模式向量,它是部分递归网络的唯一输入。第二个分量是一个状态向量,它在每一步中通过下一个状态函数给出。通过这种方法,可以用一个简单的前馈网络来模拟部分递归网络的行为,该网络不是通过递归的链接隐式地接收到状态,而是作为输入向量的一个显式部分。在这种意义上,反向传播算法可以很容易地修改为局部递归网络的训练[10]。在部分回归网络的模拟器中有以下的学习功能:标准的反向传播,标准的反向传播与动量,Quiqprop和Rprop。我们对这些学习函数做了一些比较研究。但是,反向传播的变体在标准的反向传播方面并没有显著的改善,至少在我们的例子中是这样。这些学习函数的参数与这些算法的常规前馈版本相同,学习的参数是学习速率eta;= 0.02,动量alpha;= 0.2。

该网络的设计目的是预测给定时间序列的过去4个值的交通量。从数据中提取出一组1000个连续15分钟的样本,这是36天的体积。一组被划分在一个训练集(4times;7天(一周))和测试集(2times;7天(一周))。

3.4模型的性能

该模型从每日的交通概况中生成未来24小时内的预测。图2显示了随机选择的天数的目标的输出流量的时间变化。该网络扩展了整个数据集,结果非常令人满意。在图中,可以看到原始流量与神经网络预测值的比较。如所示,预测值和实测值是一致的。

评价模型的性能可以通过均方误差,MSE =sum;i|ti-oi|2,计算预测与实际需求之间的差异。未来24小时左右的预测平均误差,大约是0.003。该模型性能的另一个可使用参数是预测最大误差。

基于Jordan网络的模型显示了非常好的概括能力。即使网络测试的数据集比训练所用的数据要晚几个月,预测的

图2:随机选择的周一、周五和周日的预测和测量的交通量的时间变化

准确性依然很高。这一点特别有趣,因为它表明,如果不使用适应性学习,就可以开发出准确的预测模型。

3.5不同时间范围的预测

我们区分三种形式的预测,描述如下:

  1. 长期预测。长期预测是一种以会话为导向的程序,它提供了未来一周的预测。它依赖于存储在知识库中的一个星期的历史参考模式,会话信息考虑了如夏季时间和圣诞节假期因素。
  2. 中期预测。这提供了一个24小时的时间范围。如果这一天被认为是普

    剩余内容已隐藏,支付完成后下载完整资料


    资料编号:[24649],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。