ViBe:一种用于估计视频序列中背景的强大随机技术外文翻译资料

 2022-12-25 14:18:13

英语原文共 4 页,剩余内容已隐藏,支付完成后下载完整资料


ViBe:一种用于估计视频序列中背景的强大随机技术

Olivier Barnich 和 Marc Van Droogenbroeck

University of Liegrave;ge Montefiore Institute, INTELSIG Group Liegrave;ge, Belgium

摘要:背景差减法是许多自动视频内容分析应用中的关键步骤。虽然到目前为止已经提出了许多可接受的技术用于背景提取,但是仍然需要在对多种环境的适应性,噪声敏感性和计算效率方面产生更有效的算法。 在本文中,我们提出了一些有效的方法,可以提高准确性,减少计算量,主要的创新关注是使用一种随机策略选择一个值来创建一个基于样本的背景估计。据我们所知,这是第一次在背景提取领域中使用随机聚合。 此外,我们提出了一种在图像的相邻像素之间传播信息的新颖方法。 本文详细介绍的实验展示了我们的方法如何改进其他广泛使用的技术,以及它如何优于这些噪声图像技术。

关键词:监视,模式识别,信号分析,视频信号处理

1.引言

背景差减法是自动视频内容分析中最广泛使用的工具之一,尤其是在视频监控中。多年来已经提出了许多用于背景减除技术的方法(参见[1,2]的调查)。在大多数情况下,这些方法都是为每个像素位置构建了近期历史的模型,通过将它们中的每一个与相应的像素模型进行比较来实现新像素值的分类。 这些技术可以分为两类:(1)对每个像素位置使用参数模型的参数技术;(2)通过聚合每个像素位置的先前观察值来建立其模型的基于样本的技术。

高斯混合模型[3]可能是最流行的参数化技术。它具有自适应性,能够处理动态环境背景的多模态外观(改变时间,云,树叶......)。然而,由于其灵敏度无法准确调整,因此其在背景中成功处理高频和低频变化的能力存在争议,如文献[4]中所述。此外,模型参数的估计(尤其是方差)对于噪声图像可能成为问题。

基于样本的技术[4,5,6]通过从观察到的像素值构建其模型来避免参数估计步骤,这增强了它们对噪声的鲁棒性。新观察到的值直接包含在其像素模型中,为后台的高频事件提供快速响应。然而,以不同的速度发展的伴随事件的可能性是有限的,因为它们首先在第一次成功的情况下更新了像素模型。事实上,它们中的一部分在每个像素点可以利用两个子模型[4, 5]: 短期模型和长期模型。虽然这是一个方便的解决方案,但它是人为的,并且需要精确调整才能在任何给定情况下正常工作。

本文提出了一种基于样本的背景差减法算法。第一个贡献是随机选择政策的持续时间,这可能会在一定程度上影响到像素模型的构成价值。它使得能够使用每个像素的合理大小的单个模型成功地处理伴随事件。第二个贡献与后处理相关,其中所有上述方法都依赖于对其结果给出一定程度的空间一致性。为此目的,我们使用创新的,快速的,简单的空间信息传播方法,随机地分隔相邻像素的像素值。因此,我们的方法能够直接产生空间相干结果。 作为第三个贡献,我们提供了瞬时初始化技术,使我们的算法可以从序列的第二帧开始使用。

第2节描述了我们的新背景差减法算法。实验结果详见第3节。第4节总结了论文。

图1 为了对进行分类,我们计算了围绕半径r的球体中包含的样本数。

2.ViBe:一种新的背景差减法算法

我们现在描述背景差减法算法。我们称之为“视觉背景提取”。我们首先定义用于估计背景的像素模型。

2.1.像素模型和分类过程

我们用表示像素x的时间t处的值。许多先进技术(包括核密度估计[4]和高斯混合模型[3,7])用于提供像素x的时间概率密度函数(pdf)的估计。一旦建立模型,算法将像素值分类为背景或前景像素值,取决于它在估计的pdf中“确定”。这种方法的一个主要缺点是pdf的评估是一个全局过程;存储在像素模型中的外层会改变pdf的形状,尽管它们在多色空间中的值可能与相距很远。

我们的方法有很大不同。 我们将多色空间中的值限制在局部邻域中。在实践中,我们不估计pdf,而是使用一组样本值作为像素模型。为了对值进行分类,我们通过定义以为中心的半径为R的球体()将其与样本集中的最接近的值进行比较。如果该球体与样本集(见图1)的交叉点的基数高于给定的最小阈值,则像素值被归类为背景。更正式地说,我们用最小值与这个式子进行比较

(1)

确定模型精度的两个参数是球体的半径R和最小基数min。实验表明,独特的半径R和2的基数提供了优异的性能。没有必要在背景差减法期间调整这些参数也不需要为图像内的不同像素位置更改它们。注意,由于选择样本数n和min进行固定并对同一决策产生影响,因此可以使用n比率调整模型的灵敏度。

2.2. 模型随时间更新

要随着时间的推移获得准确的结果并处理场景中出现的新对象,必须定期更新模型。 由于我们的模型我们直接将与样本进行比较,因此模型必须保留样本以及持续多长时间的问题至关重要。在2.2.1节中,我们提出了一种值随时间更新的原始生命周期政策。

在设计背景估计方法时,总是提出在模型中包不包括前景像素值的问题。 保守更新(模型中不包含前景值)一开始似乎是显而易见的选择,但如果背景物体突然开始移动(例如停放的汽车),则会导致死锁情况。相反,当遇到缓慢移动的目标时,盲目更新可能会在背景模型中包含前景信息。严格地说,当背景被屏蔽时,时间信息不可用。由于背景差减法是一个时空过程,因此,最好的回退策略包括利用空间信息。这是第2.2.2节中提出的信息传播方法所起的作用。因此,我们可以负担使用保守的更新方案。随着背景演化信息从相邻像素扩散,由背景物体移动引起的“鬼影”逐渐消失。

2.2.1.样本值生命周期策略

以前的方法使用先入先出策略来更新其模型。为了正确处理场景背景中的各种事件,一些作者(例如文献[6])选择在像素模型中包括大量(最多200个)样本。其他文献[4,5]甚至包含两个时间子模型,来成功处理快速和缓慢的修改。

从理论的角度来看,最好保证样本值保持在样本集内的概率是单调衰减的。它提高了估计的相关性,并允许使用更少的样本。我们通过随机选择更新像素模型时要替换的样本来实现这一点。一旦选择了要丢弃的样本,新的值将替换丢弃的样本(参见图2)。从数学角度上来说,可以看出,根据这种更新机制,像素样本存在的时间在稍后时间仍然存在的概率是,可记为

(2)

图2 图1所示的模型更新后,这个图片展示了n个同样可能的模型中的3个。

2.2.2.空间一致性

先前的解释和技术确实忽略了图像中的像素位置。但是为了确保整个图像模型的空间一致性并处理实际情况,例如小型相机移动或缓慢演变的背景物体,我们采用了类似于为更新过程开发的技术,在更新过程中我们随机选择并更新当前像素附近的像素模型。我们分别用和表示像素x的空间邻域及其值。假设通过插入决定更新x的样本集。然后我们还使用该值来更新随机选择的邻域中的一个像素的样本集。

由于像素模型包含许多样本,因此可能意外插入邻域模型的无关信息并不会影响检测的准确性。此外,在观察到的值可以进一步传播之前需要匹配观察值,从而阻止了无关信息的错误传播。这种自然限制抑制了误差的扩散。由于低噪声级和固定摄像头的操作限制,我们确保空间一致性的方法呈现出与其他技术类似的结果。但是,如果不满足这些限制,例如当相机移动或在低照明的情况下,Vibe优于其他技术。在第3节中,我们将进一步分析存在噪声时的分割结果。

注意,选择策略或空间传播都不是确定性的。换句话说,如果算法再次在同一图像上运行,结果将始终不同。尽管不寻常,但让随机过程决定要丢弃的样本的策略被证明是非常强大的。这与引入衰落因子或使用长期和短期价值历史的已知策略不同。

3.实验结果

我们所有的测试都是使用包含20个样本值,半径为30的球体和基数为2的模型进行的(见等式1)。这组参数是固定的(没有参数调整)。

3.1 模型初始化

尽管模型可以从任何类型的初始化中轻松恢复,例如通过选择一组随机值,但是可以方便地尽快获得准确的背景估计。理想情况下,我们希望能够从第二帧开始分割视频序列,第一帧用于初始化模型。由于在第二帧之前没有可用的时间信息,我们使用每个像素空间邻域中的值来填充像素模型。更确切地说,我们使用在第一帧的邻域中随机取得的值来填充它们。该策略被证明是成功的:背景估计从第二帧开始有效。唯一的缺点是第一帧中移动物体的存在会引入鬼影,鬼影必须随着时间的推移而褪色。

3.2 与高斯混合模型的比较

文献[5,7]中提出的增强高斯混合模型(EGMM)是一种最先进的背景差减法确定性参数方法。通过使用它和ViBe获得的结果的视觉比较,得出结论,尽管两种技术不同,但两种技术给出的室内序列的整体分割精度是等效的。EGMM算法的较高误报率由我们算法的较高假阴性率来平衡。但是,使用我们的技术,前景对象边界更清晰。

室外摄像机序列会导致不同的观察结果,因为图像往往质量较差。它们遭受由风引起的相机抖动,更高水平的背景运动和高图像压缩等带宽减少问题。我们的测试序列之一是在多雨和刮风的日子拍摄的,具有很强的压缩比。虽然ViBe设法保持了光荣的结果,但EGMM算法明显受到这些困难条件的影响。 噪声似乎阻止EGMM算法对模型参数的正确估计。

3.2.1 抗噪声能力

为了能够在嘈杂的条件下客观地比较EGMM和ViBe,我们使用类似蓝屏的过程生成室外序列的地面真实分割图。我们在地面实况序列中添加了椒盐噪声,并计算了几个级别噪声的精度和召回率。

图3中所示的可视化结果是不言而喻的。不过,让我们看一下图4的精确度和召回曲线。曲线清楚地显示出ViBe对重要的加性噪声的抵抗水平,即使PSNR的噪声级低至30 [dB]。

另一方面,即使对于少量附加噪声,EGMM算法的精度也会非常快地衰减。在精度保持在有意义的水平的区域中,RGB颜色空间中ViBe的回忆曲线位于HSV颜色空间中我们的技术得到的曲线和EGMM算法得到的曲线之间。

图3 对于PSNR,ViBe(左)和EGMM(右)的结果分别为51 [dB],39 [dB],30 [dB],25 [dB]和19 [dB]。

4.结论

在本文中,我们提出了一种新的基于样本的背景差减法算法ViBe。 由于我们的更新策略、我们的空间信息传播方法和我们的瞬时初始化技术,我们能够处理以不同速度发展的若干伴随事件,获得空间连贯的分割图而无需任何形式的后处理,并从序列的第二帧开始获得有意义的结果。此外,由于ViBe可以使用严格保守的更新方案并直接将像素值与存储在像素模型中的样本进行比较,因此它对噪声具有出色的稳健性。

图4 ViBe的精确度(左)和召回(右)曲线以及几个PSNR的EGMM算法。

在我们的实验中,我们使用室外序列的地面真值分割图来比较ViBe与独立的最新技术(文献[7]中提出的EGMM)的结果。虽然我们发现EGMM的性能在存在噪声数据的情况下衰减很快,但我们的技术对大量的噪声有很强的抵抗力。它甚至设法为PSNR产生低至30 [dB]的精确结果。ViBe不需要任何微调;它在各种环境中产生良好的结果,具有固定的三个参数值(每个像素模型存储的样本数,像素值和样本之间的匹配阈值,以及将像素合并到场景背景中所需的匹配数)。

5.参考文献

[1] M. Piccardi, “Background subtraction techniques: a review,” in Proceedings of the IEEE International Conference on Systems, Man and Cybernetics, 2004, vol. 4, pp. 3099–3104.

[2] R. Radke, S. Andra, O. Al-Kofahi, and B. Roysam, “Image changedetectionalgorithms: Asystematicsurvey,” IEEEtransactions on image processing, vol. 14, no. 3, pp. 294–307, 3 2005. [3] C.StaufferandE.Grimson, “Learningpatternsofactivityusing real-time tracking,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 22, no. 8, pp. 747–757, 2000.

[4] A. Elgammal, D. Harwood, and L. Davis, “Non-parametric model for background subtraction,” in ECCV rsquo;00: Proceedings of the 6th European Conference on Computer Vision-Part II, London, UK, 2000, pp. 751–767, Springer-Verlag.

[5] Z. Zivkovic and F. van der Heijden, “Efficient adaptive density estimation per image pixel for the task of background subt

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[20619],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。