复杂动态背景下运动目标检测的多成分群稀疏RPCA模型外文翻译资料

 2022-12-17 14:50:48

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


复杂动态背景下运动目标检测的多成分群稀疏RPCA模型

摘要:鲁棒PCA模型及其变体是一种很有前途的运动目标检测工具,它将视频或图像序列矩阵分解为低秩背景成分和稀疏运动目标成分。虽然它们能很好地处理静态背景,但在复杂的动态背景下,如喷泉、波纹、摇动树叶等,背景运动通常是由稀疏成分混合而成。同时,前台对象检测到的边界往往是不准确和不完整的。针对上述问题,本文提出了一种多成分群稀疏RPCA模型。为了将前景运动对象与动态背景分离,我们的模型将观察到的视频或图像序列表示为三个成分,即、一个低秩静态背景、一个组稀疏前景和一个动态背景。为了对目标边界先验进行积分,将每一帧过度分割成超像素,并将其作为组。定义组稀疏范数的信息。因此,群稀疏范数将每个超像素作为一个整体来度量稀疏前景。此外,为了提高稀疏前景运动与动态背景成分的可分性,引入了一个非相干项。在此基础上,进一步应用乘子算法的交替方向法对模型进行求解。大量的实验结果表明,该方法优于一些有代表性的方法。

关键词:运动目标检测,低秩,稀疏矩阵

  1. 介绍

视频运动目标检测[1,2]是智能视频处理中的一个基础性问题,在视频对象编码、基于内容的视频检索、智能视频监控、视频编辑等领域有着广泛的应用。运动目标检测[4]旨在从视频或图像序列中自动提取运动目标。从模式识别的角度来看,运动目标检测是一个分类问题,它将视频内容分为运动目标的背景和前景。

在以往的研究中,已经提出了许多算法,主要有背景减法、帧差分法、光流法等[5,6]。虽然这些方法取得了很大的成功,但是当背景环境发生动态变化时,它们的鲁棒性还不够。背景的复杂动态变化如地面光照的变化、物体运动的多样性(非刚性变形)、风中的雨、波浪、喷泉、树叶和相机的抖动等,给运动物体的检测研究带来了许多挑战。针对复杂动态背景下运动目标检测问题,提出了一种有效的运动目标检测模型。

近年来,鲁棒主成分分析(RPCA)[7,8]模型被引入视频运动目标检测问题,RPCA也引起了计算机视觉界的广泛关注[9-11]。Candes等人将数据矩阵M分解为L S。其中L为低秩成分,S为包含异常值的稀疏成分[7]。视频的背景强度通常在序列中保持不变,除了光照变化或动态纹理的周期性运动等引起的变化。因此,背景图像与相邻帧密切相关,形成低秩矩阵l,前景定义为与背景运动不同的任何对象。前景移动对象会引起背景低秩模型无法拟合的强度变化,通过将L上的秩算子松弛为核范数,将S上的稀疏算子松弛为L范数,通过凸优化有效地求解分解模型,将前景运动目标分解为稀疏成分。该方法为运动目标检测提供了一个新的研究方向。

在后续的研究中,Zhou等人[12]提出了一种GoDecomposition (GoDec)算法,将噪声成分引入到RPCA分解中。GoDec可以很好地处理一些光噪声和光照变化的背景。然而,复杂的动态背景的某些部分仍然会被误认为是运动的对象。Wang等人提出了一种用于背景建模的概率鲁棒矩阵分解(PRMF)方法。PRMF由拉普拉斯误差和高斯先验组成,分别对应l1拟合损失和l2正则化项。PRMF仍未能处理好背景复杂的案件。虽然RPCA模型及其相关的变体能够很好地处理静态背景,但是在复杂动态背景的情况下,喷泉、波纹、摇动树叶等背景运动仍然混合在离散稀疏成分中。

不难发现,运动物体在视频中并不是随机出现的。它们的空间分布具有一定的相关性和连续性。然而,RPCA及其变体使用l1标准约束来识别每个像素是否是运动目标,这不利于消除由噪声和随机背景动态背景干扰引起的非结构化稀疏成分。前景对象检测到的边界通常是不准确和不完整的。考虑到运动物体的空间连续性分布,测量稀疏成分的准则也应具有结构相关性,以便有效地分离运动物体。因此,周等人[14]提出了一种检测连续输出的方法(称为脱色)。在低秩表示框架中,利用马尔可夫随机域(MRFs)约束,将连续目标检测和背景估计集成到一个优化过程中。然而,在动态场景下,去色器仍然不能很好地检测出运动对象的界限。一些工作尝试先估计前景的可能区域,以便后续分析。在[15]中,视频序列被过度分割成多个同质组,使用归一化割方法将这些组作为分组信息来定义组稀疏RPCA模型(G-RPCA)。Gao等[16]提出了一种分层的双通道RPCA方法来检测前景对象,其中第一个通道的RPCA识别出前景的可能区域,第二个通道的块稀疏RPCA将前景对象的空间相干性应用到离群矩阵中。这两种方法都能很好地利用空间相干性的先验进行前景检测。然而,如何很好地处理大动态背景运动仍然是一个具有挑战性的问题。

为了解决上述问题,我们提出了一种多成分群稀疏RPCA模型来提高运动目标检测的鲁棒性。如图1所示,我们的模型将观察到的视频或图像序列表示为三个成分,即、低秩静态背景、组稀疏前景和动态背景。此外,为了准确检测目标边界,使用简单线性迭代聚类(SLIC)[17,18]将每一帧过度分割成超像素,作为结构化分组信息,定义组稀疏范数,对稀疏前景进行分割。该模型能够有效地检测前景对象并识别其边界。综上所述,本文的主要工作包括:

  1. 多成分低秩表示模型代表低秩静态背景A、群稀疏前景El和动态背景E2的运动目标序列。为了提高稀疏前景运动E与动态背景运动E的可分性,引入了非相干项。通过该模型,我们可以检测到一个更有意义的运动对象E,并对复杂的动态背景保持更强的鲁棒性。
  2. 利用运动物体的边界先验,每一帧的超像素代表同质组。然后在同构组上定义L0群稀疏范数,如[15],它可以将同构组中的所有像素作为一个整体来识别前景是否移动。因此。我们的模型可以更有效地定位运动物体的边界。
  3. 多成分群稀疏RPCA模型

本节中,我们详细介绍了多组件组备用RPCA模型。首先,采用SLIC算法[17,18]生成用于定义群稀疏范数的全生群。然后,引入多成分表示,将图像序列分解为三个成分。最后,结合L0组稀疏约束和多成分表示,提出了鲁棒运动目标检测的多成分组备用RPCA模型。

    1. 均匀的组织

在本节中,符号表示视频序列的帧,是由M个像素组成的列向量。通过将每一帧叠加为列向量,我们可以使用矩阵表示具有N帧的视频或图像序列。然后,我们应用SLIC算法[17,18]将每一帧过度分割成一组超像素。SLIC采用k均值聚类方法有效地生成超像素。尽管简单,SLIC坚持边界,以及或优于之前的方法,如标准化削减[19],Tur boPixels[20]等。同时,它具有像素数的线性复杂度和更高的存储效率,可以提高视频和图像序列的分割能力。SLIO算法不强制超像素的连续性,这意味着如果一个区域内的像素点显著不同,超像素可以分割成多个区域。因此,同一超级像素中的像素很可能属于同一对象。

在[15]的激励下,生成的超像素可以看作是同构的群,为后续处理提供运动目标的边界信息。将gi表示为由生成的第i个超像素内的所有像素坐标组成的第i组。视频或图像序列的整体组信息可以表示为

其中J是基团的总数。组集G满足的约束,可以覆盖所有的超-1视频序列中的超像素。图2为水面序列内一幅图像的过分割结果。可以看出,通过SLIC过分割得到的群体能够有效地定位行人边界的边界。每一个群体都倾向于呈现相同的运动特征。同构组的所有像素都应重新编码为一个整体,作为前景移动对象或背景进行区分。因此,我们打算使用组集G来定义组稀疏性规范[21]来分隔移动对象。

    1. 图像序列的多成分表示

经典的RPCA模型有一个潜在的缺点,就是将背景中的一些动态变化误认为稀疏成分E(如喷泉,运动的电梯,等等)。为了解决这个问题,低秩成分L可以通过增加秩适应更多背景的变化, 这样,只有有意义的移动对象才会被分离到E组件中。然而,当动态背景的变化是相对的,甚至大于有意义的运动对象时,这种方法将不再有效。为了更好地解决这一问题,我们提出了多成分表示模型,并将图像序列D分解为:

其中A为低秩静态背景,E为群稀疏前景El, E2为动态背景。通过将稀疏成分E分成两个成分到E和E2,我们期望El只包含有意义的前台移动对象。

图3展示了这样一个具有挑战性的例子,汽车始终存在,背景是动态的,包括光照变化和摇摆树。理想情况下,样本图像应分解为静态背景A、前台汽车对象Et和动态背景E2。为了实现这个目标,如何设计三成分的测量标准是一个关键问题。

    1. 我们的模型

表示矩阵表示序列的所有N帧。结合对象边界先验(1)和表示模型(2),提出的模型可以写成

其中为描述背景的低秩矩阵; 是描述运动目标的稀疏前景矩阵; 为动态背景,lambda;1和lambda;2为正则化参数,权重为三个成分的比值。项表示矩阵A的凸核范数,即A的奇异值之和,用于捕捉静态背景。将f -群稀疏范数定义为

其中card{-}为集合中元素的个数,组信息G由SLIC获得。E(g)表示坐标集合g中El的像素;被重新排列成一个向量。这一项表明只有少数齐次群E1(gi)是非零的。同时,对于E1,非负元素约束Egt;0是可选的。是动态背景系数E2的弗洛贝尼乌斯范数。背景的动态变化通常不是稀疏的、非结构化的,因此Frobenius更适合测量E2。是不相干项,其中E1和E2分别表示E1和E2的第r列。这一项可以防止运动对象同时出现在E1和E2中,从而提高了E1和E2的可分性

  1. 优化算法

目标函数式(3)为多变量问题,与A、El、E2无凸连接。在这里,我们采用了一种改向乘法器(ADMM)优化算法[22-25]来解决这个问题。我们首先推导式(3)的增广拉格朗日函数为:

其中为拉格朗日乘子,u为正惩罚参数。ADMM算法将多变量优化问题(5)转化为多个单变量的简单子问题。这些子问题交替求解,直到满足收敛准则,假设当前迭代次数为k,具体迭代过程如下:

估算低秩静态背景 :根据以下目标函数修正E1, Ez,更新A:

式(6)可简化为

我们可以用窄奇异值收缩法求解式(7):

其中为奇异值阈值操作,

  1. 估计群体稀疏前景,:修正A, E2,更新E,由下式:

将式(9)化简,可得优化问题为:

然后通过组硬阈值操作求解式(10)19)。的更新公式如下:

其中每组的阈值收缩公式定义如下:

此外,如果需要E1的非负约束,则可以选择将凸集中的多边形投影Pc应用于Ek 1。

(3) 根据以下函数估计动态背景

将上述方程对E2求导为零,得到更新公式:

(4)将拉格朗日乘子更新为

重复上述迭代过程,直到满足以下收敛准则。

其中e1gt;和e2gt;0为公差常数。同时,为了加快迭代过程[22],将参数u更新为:

其中pgt;1为放大系数,mu;max为的上界。完整的优化算法如下。

我们采用ADMM算法通过迭代四个子步骤来求解式3。第二步涉及矩阵T的硬阈值收缩,计算复杂度O(MN),其中MxN为矩阵d的大小。第三步和第四步分别更新动态背景和拉格朗日乘子,计算复杂度O(MN)。实际上,整个算法的复杂度由第一个子步骤决定。利用通常的SVD技术,利用PROPACK包和秩预测[27]计算背景矩阵A的前导r奇异值,求解该子问题的复杂度仅为O(rMN),其中r为背景矩阵A[28]的秩。在求解不超过三个块的凸问题时,ADMM通常收敛。近年来,一些工作lso将ADMM的范围扩展到更一般的问题,并对其进行了理论保证[29,30]。然而,对于非凸问题,没有理论保证保证ADMM的收敛性。为了说明求解式(3)的算法1的收敛性,我们对参数E1=E2 =1e-5的机场序列和水面序列进行了数值实验,报告相对误差RelErr1和RelErr2随迭代次数的衰减曲线如图4所示。从图中可以看出,RelErr1和Rel Err2的收敛性较好,趋于稳定,证明了算法的有效性。

  1. 实验结果与分析

为了评估我们提出的算法的性能,我们对四个广泛使用的视频剪辑和序列进行了验证。(a)机场序列记录了熙熙攘攘的机场大厅,彼德斯特里亚人总是在那里;(b)开关灯视频序列记录了图书馆角落里的人的状态,其中光照变化明显。这两个是室内夹子。此外,我们还测试了我们的算法在三个户外序列。(c)水面视频序列描述了行人在海面上行走,海面上有很多波浪的扰动;(d)雨录序列描述一辆卡车在大雨下右转;(e)摇摆树序列呈现的是一个行走的人身后摇摆树的树枝。这棵树波动不规则,幅度很大。为了更好地评价我们的算法,我们将其与一些竞争算法进行比较,包括RPCA[7]、GoDec[12]、PRMF[13]、Decolor[14]、G-RPCA[15]和双通道RPCA[16]。

图4所示。相对误差RelErrl和RelErr2(对数尺度)随迭代次数变化的曲线。

采用定性和定量相结合的方法对不同算法的运动目标检测结果进行了评价。在定性评价中,采用了典型序列帧的检测运动掩模。定性讨论的基础是运动掩模的质量,看它们与对应的地面真值图像有多接近。

4.1。定性评价

图5-9为RPCA、GoDec、PRMF、De color、G-RPCA、两遍RPCA的检测结果,我们提出的算法使用上述5个序列作为测试序列。这两个人总是在现场,而且是闭塞的,这就增加了执行任务的难度。在RPCA、GoDec和PRMF的检测结果中,存在较大的背景干扰,且边界为।

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[20441],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。