基于近似动态规划的交叉口短时交通流量预测外文翻译资料

 2022-07-28 14:15:29

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


基于近似动态规划的交叉口短时交通流量预测

关键词:预测; 短期交通流量; 近似动态规划; 神经网络

摘要。 在本文中,考虑到相关道路的影响,基于近似动态规划,我们提出了一个短时交通流预测的模型。 首先,使用误差函数作为目标函数,构造系统性能指标,根据最小索引在线调整动作网络,生成近似最优控制向量和控制矩阵,然后我们可以得到在特定道路和时间的交通流量数据进行预测。为了说明这种方法是如何工作的,我们使用深圳福田洪利路与上布路交叉口交通流量作为实验数据,以此来证明该方法可以提高预测精度,满足实时预测的要求。

引言

作为城市道路的连接节点,交叉口的交通是否通畅直接影响了整个道路是否通畅。当车辆从不同方向经过交叉口时,交叉口承受着巨大的压力,交叉口的脆弱性是很明显的。因此人们开始着力于交叉口控制的研究,研究的关键是提供准确的实时交通流预测信息,以为接下来的措施提供合理的依据。

传统的预测方法主要是利用统计分析历史交通流量并且通过拟合交通流线性近似曲线来进行预测。然而,交通系统是一个巨大的复杂的随着时间改变的非线性系统,线性拟合方法因此不能满足预测的准确性上的需要。因此,用于寻找最相似的历史数据的非参数模型以及用于映射非线性参数的人工网络模型应运而生。以适应各种交通状况并提高预测精度,人们开始使用神经网络结合多种智能优化方法来进行预测。典型的模型就是wavelet的神经网络模型,遗传神经网络模型,贝叶斯神经网络模型等等。然后,文献中提供了一种结合了两种或更多种预测模型的联合模型,既发挥了优势又避免了缺点,比起单一的预测模型有更高的预测效果。

在部分主路与主路相交交叉口,由于进口车道数量较多,每条车道到达交通流可能存在较高非均衡性,针对这种情况,传统信号优化方法不够理想。文献中提出一种基于交通预测的信号控制优化方法,将交叉口部分进口车道设置为可能存在多个流向的多功能进口车道,根据检测和预测数据实时调整该车道流向功能,进一步优化每个周期的相位时间对交叉口进行信号控制。

神经网络方法通常根据经验选择训练数据,或仅仅使用当前时刻的交通流量。由于道路的相关关系,预测的道路将受到相关位置的影响。尤其是当预测时刻与训练数据之间的模型不同时。这将会引起巨大的误差。文献指出,通过主成分分析法发现,考虑到相关道路的影响,相关道路和相关历史交通对预测结果有着巨大的冲击。然而,由于交通系统的不确定因素,当前时刻的主分量不一定是下一时刻的主要分量,随着时间的流逝,这种方法的预测精度将大大降低。

正是基于以上所述,本文将会提出一个基于近似动态规划的交叉口短时交通流预测模型。近似动态规划(ADP)能够根据环境变化的反馈信号获得近似最优控制策略,这是不依赖于分析模型的。它具有良好的泛化性,可以在线调整,它适合处理时变复杂系统和动态复杂任务。本文使用的预测的误差函数和实际流量作为目标函数,以确保系统的性能目标。

限制网络和动作网络可以彼此调整以使其最小化并产生控制向量以最小化整体预测误差:根据控制向量创建控制矩阵,通过乘以相关十字路口和当前道路交通流量的变量获得新的训练数据。换句话说,这种方法将特殊相关位置当前和历史的交通流当做训练数据。文献证明了性能目标对误差的偏导数的迭代收敛,这说明了ADP的预测方法在短时交通流预测中应用的可行性。

ADP的控制思想

给定离散时间非线性动态系统

x(t 1)=f[x(t),u(t),t] (1)

其中x(t)isin;Rn表示系统的状态向量,u(t)isin;Rm表示控制动作。

假设与该系统相关联的性能指数(或成本走向函数)是:

J[x(i),i]= U[ ( ), ( ), ] (2)

其中U(·)被称为效用函数,gamma;是折扣因子,0 lt;gamma;lt;1。注意,函数J [x(i),i]取决于初始时间i和初始状态x(i),并被称为状态成本x(i)。动态规划的目的是选择一个控制序列,目的是使方程2中的函数J达到最小。根据Bellman,从时间t开始最优成本为:

J*[x(t),t]=min(U[x(t),u(t),t]) gamma;J*[x(t 1),t 1] (3)

在t时刻的最优控制u *(t)是实现这个最小值的u(t)

u*[t]=arg min(U[x(t),u(t),t] lambda;J*[x(t 1),t 1] (4)

方程3是离散时间系统的最优原理. 即动态规划理论。因为成本函数J通常是未知的,因此应用传统方法来解决这个为题就十分困难。并且随着系统规模的增加,时间复杂性和空间复杂性呈指数增长,即所谓的“维度灾难”现象。这个想法是通过使用诸如神经网络的函数近似结构近似编程解决方案来近似成本函数。

ADP通常由三个模块组成:评价模块,模型模块和动作模块。如图1所示(信号流的实线,参数训练流的虚线)。模型模块和动作模块是传统的系统模型和控制器。批评模块的输出结果是成本函数J [x(k),k],训练误差的平方。

||Ec||= 212k = e k 2 1[ J( 1) J( ) U( )]2 (5)

其中lambda;(0 lt;lambda;lt;1)是贴现因子,U(k)是决定控制序列的效用函数。当 Ec(k)=0 ,对于所有的k,都有

J(i)=U(i) gamma;J(i 1)=U(i) gamma;[U(i 1) gamma;J(i 2)]=hellip; U(k ) k i (6)

方程6具有与动态规划的成本函数相同的定义,因此,批评模块可以用于定量引导动作模块的优化。也就是说,批评模块可以通过更改动作模块的参数来达到最大输出。获得的动作模块可以得到最优或近似最优控制变量。

基于交通预测的交叉口信号控制的特点是根据预测交通量形成系统控制方案。由于信号每执行一个相位,交叉口到达交通量就有所更新,为保证预测结果的准确性,应将新交通量数据作为预测数据源,预测结果的更新预示着信号每执行1个相位就必须对新的配时参数进行计算。多功能车道通行流向改变,交叉口排队情况也随之发生改变,应按照周期计算进行调整。当前周期信号执行结束时,利用交叉口进口设置的检测器检测数据预测下一周期车辆平

均到达率,根据延误模型选取多功能进口车道流向,周期内其他相位按照确定流向执行控制方案。

下游时间间隔t内到达的车辆数与上游时间区间[t -Tmax,t -Tmin]内每个时间间隔内离去车辆数存在某种映射关系,而这种关系不能用一般的函数形式表达.而传统的车队离散模型

是假设车辆速度或行程时间服从某种特定的概率分布,基于此推导下游与上游车流分布的关系式.但由于不同路段的车辆速度或者行程时间并不一定服从相同的分布[6-10],即模型应用时,均要选择合适的分布去描述交通流特征,且这种分布只能在一定程度上表征动态交通流特征.考虑到神经网络能够描述任何线性可分的复杂随机系统[19-20],且不需要任何基本假设,可根据当前时刻的历史数据通过训练来表征下游到达车辆数与上游离去车辆之间的映射关系.所以本文拟构建基于神经网络的小时间粒度动态交通流预测模型.

综上可知,在给定网络的输入层—隐含层—输出层结构和样本后,可设定误差范围对网络进行不断训练优化,使其输出值与理论值达到允许误差范围.因此,实际过程中应用神经网络只需根据实际问题设计好网络结构,再对网络进行训练,最后可根据新的输入通过网络仿真计算得出预测值.

交叉口检测器分类的过程往往是一个模糊的概念,在进行分类时所依据的数据指标也没

有一个很明确的界限,因此采用模糊理论方法会更符合实际需求。模糊聚类方法给出的分类结果不是说事物绝对地属于某一类或绝对的不属于某一类,而是指明在什么程度上属于某一类。在此可以依据相邻各个交叉口的交通流量来对各个检测器进行分类,确定出无检测器交叉口属于哪一类,然后预测无检测器交叉口的交通流量。其分析过程主要包括:数据的选取,数据的标准化处理,模糊聚类实现,结果对比分析。

在神经网络结构确定以后,需要通过历史数据对网络进行训练.如要预测t时刻的下游车辆到

达情况,可采用t时刻前的历史数据对网络进行训练.考虑到网络训练需要一定的时间,所以可以隔一段时间对网络训练或优化一次,如5 min 内优化网络一次,保证时间间隔能够完成神经网络训练.最后采用训练好的网络对下游车辆到达分布进行实时预测,其中神经网络的输入层节点可通过检测器获取,而下游通过停车线的车辆到达数据也可以根据检测器获取,可用于训练神经网络.

对于交通流预测,动作网络使用实际和预测交通流量误差x(k)作为输入变量,并生成控制向量u(k)。一方面,它可以通过评估网络的控制向量和调节行动网络的优越性近似成本函数,进一步生成近似最优控制向量;另一方面,它可以通过预测网络得到下一刻的预测结果。

由于灰色理论适用于具有近似指数增长趋势的时间序列预测;多项式预测方法相对灰色模型具有一定的趋势跟踪能力, 随着多项式最高次数的增加,这种跟踪能力有所加强, 但对于短时交通流的复杂变化情况, 采用以上两种预测方法进行趋势跟踪都有很大的局限性.为此, 在仿真试验中采用分段滚动的预测策略, 即在预测过程中加入一个最新采集到的交通

量数据时, 去掉一个最老的交通量数据, 始终以包含新息的交通量数据为基础进行一步预测.

具体预测模型如下。

ADP短时交通流预测模型

交叉口预测模型。对于城市交叉口短时交通流的实时预测,假设东方向是预测截面,命名为道路a。南方,西方和北方是相关道路记为交叉口b,c和d。预测模型如图二所示。

在传统方法中,交通流预测q(t 1)可以表示为等式7

q(t 1)=Q[qa(t),qa(t-1),hellip;,qa(t-n), hellip;] (7)

其中Q(·)是预测函数,qa(t)是t的实际交通流量,交叉点预测交通流与当前时刻和前n时刻的交通信息相关。

考虑相关部分的影响,构造向量qp(t)为式8,包括预测部分和具有4n个交通数据的相关部分。

qp(t)= [qa(t),qa(t-1),hellip;,qa(t-n),hellip;,Q`b(t),Q`c(t),Q`d(t)] T (8)

其中Q`b(t),Q`c(t),Q`d(t)分别是道路b,c和d的前n点交通流量。然后,q(t 1)可以表示为等式9

q(t 1)=Q[qp(t)] (9)

当将所有相关数据作为预测网络的输入时,将增加计算复杂度。当训练数据包含的预测误差与预测时刻的模式不同时,预测误差更大。本文使用ADP方法产生控制向量u(t),将u(t)转换为控制矩阵‖ u(t)||,乘以等式8作为预测网络的输入。 p(t)如式10。

p(t)= || u(t)|| ·qp(t) (10)

基于ADP的预测模型。预测交通流在t时刻的实际是qa(t-1)时的t(t),TDL是延迟系统,基于ADP的预测模型如图3所示。

基于ADP思想的短时交通流量预测过程如下:

步骤1,由方程10知道p(t-1),p(t-1),通过预测网络获得下一时刻预测交通流q(t)

p(t-1)= || u(t-1)|| ·qp(t-1) (11)

其中qp(t-1)由式8推导,而|| u(t-1)|| 是t-1时由Control网络产生的控制矩阵。

步骤2,动作网络的输入x(t)为

(12)

其中Delta;T是预测间隔,qa(t)是t处的实际交通流。

步骤3,输出u(t)由输入x(t)的动作网络产生。

步骤4,将u(t)变为|| u(t)||,预测网络的输入是来自式11的p(t),并且推导出q(t 1)。

步骤5,使用x(t),u(t)作为临界网络的输入以产生输出J *(t)。

步骤6 ,令t = t 1,重复步骤1到步骤5,然后得到J *(t 1)。

步骤7,最小化Q(t)以调整Critic网络的权重。

Q(t)=E2(t)/2=[J*(t)-U(t)-J*(t 1)]2/2 (13)

其中U(t)被称为效用函数,就像是方程14中的那样,即实际和预测的误差平方的一半。

U(t)=e2(t)/2

全文共5934字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[143899],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。