ORB:SIFT或SURF的有效替代方案外文翻译资料

 2022-07-26 16:06:23

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


ORB:SIFT或SURF的有效替代方案

Ethan Rublee Vincent Rabaud Kurt Konolige Gary Bradski

Willow Garage,M enlo Park,C alifornia

摘要:特征匹配是许多计算机视觉问题的基础,如对象识别或运动结构。目前的方法依赖昂贵的描述符进行检测和匹配。在本文中,我们提出了一个基于SUMMARY的简单二进制描述符,称为ORB,它是旋转不变量和抗噪声的。 我们通过实验证明ORB比SIFT快两个数量级,而在许多情况下也是如此。 在几个实际应用中测试了效率,包括智能手机上的对象检测和补丁跟踪。

1.介绍

SIFT关键点有检测器和描述符[17],十多年前,已经在使用视觉特征的许多应用中并证明非常成功,包括对象识别[17],图像拼接[28],视觉映射[25]等。然而,它加大计算的负担,特别是对于诸如视觉测距的实时系统,或者对于诸如蜂窝状蜂窝的低功率设备。这导致了更低的计算成本的密切搜索替换;可以说,最好的是SURF [2]。还有一些研究旨在加速SIFT的计算,特别是GPU设备[26]。

在本文中,我们提出具有类似匹配性能的SIFT的计算高效替代,较少受图像噪声影响,并且能够用于实时性能。我们的主要动机是增强许多常见的图像匹配应用,例如,使得无GPU加速的低功率设备能够执行全景拼接和补丁跟踪,并减少基于标准的基于特征的对象检测的时间。我们的描述符对这些任务(以及比SURF更好)与SIFT进行比较,而速度几乎是两个数量级。

我们提出的特征建立在着名的FAST关键点检测器[23]和最近开发的Brief描述符[6]上。因此我们称之为ORB(面向FAST和旋转简介)。由于其良好的性能和低成本,这两种技术都具有吸引力。 在本文中,我们针对SIFT解决了这些技术的一些局限性,最为突出的是在Brief中缺乏旋转不变性。 我们的主要贡献是:

bull;向FAST添加快速准确的定向组件。

bull;有针对性的简化功能计算。

bull;方向分析和定向简介特征的相关性。

bull;一种用于在旋转不变性下解相关特征的学习方法,从而在最近邻应用中实现更好的性能。

为了验证ORB,我们执行测试ORB相对于SIFT和SURF的属性的实验,用于原始匹配能力和图像匹配应用程序中的性能。 我们还通过在智能手机上实施补丁跟踪应用来说明ORB的效率。ORB的另外一个好处是它没有SIFT和SURF的许可限制。

图1.使用ORB对具有视点变化的真实世界图像的典型匹配结果。绿线是有效的匹配; 红色圆圈表示不匹配的点。

2.相关工作

关键点:FAST及其变体[23,24]是在匹配视觉特征的实时系统中找到关键点的选择方法,例如并行跟踪和映射[13]。它是有效的,并找到合理的角点关键点,虽然它必须用尺度的金字塔方案[14]进行扩充,在我们的情况下,哈里斯角过滤器[II]拒绝边缘并提供合理的分数。许多关键点检测器包括定向算子(SIFT和SURF是两个突出的例子),但是FAST没有。有各种方法来描述关键点的方向;其中许多涉及梯度计算的直方图,例如在SIFT [17]和SURF [2]中的块模式近似。这些方法在计算上要求很高,或者在SURF的情况下,产生差的近似值。 Rosin [22]的参考文献分析了角度方向的各种方法,我们从他的心脏技术中借鉴了。与SIFT中的定向运算符不同,它可以在单个关键点上具有多个值,质心运算符给出一个显着的结果。

描述符: Brief [6]是一个最近的特征描述符,它使用平滑图像补丁中的像素之间的简单二进制测试。其性能在许多方面与SIFT类似,包括对照明,模糊和透视失真的鲁棒性。但是,它对平面内旋转非常敏感。Brief来自使用二进制测试来训练一组分类树的研究[4]。一旦训练了一组500个典型的关键点,树可以用于返回任何任意关键点的签名[5]。以类似的方式,我们寻找对方向最不敏感的测试。发现不相关测试的经典方法是主成分分析;例如,已经表明,用于SIFT的PCA可以帮助消除大量的冗余信息[12]。然而,可能的二进制测试的空间太大,无法执行PCA,而是使用详尽的搜索。视觉词汇方法[21,27]使用离线聚类来找到不相关的样本,并可用于匹配。这些技术也可能用于寻找不相关的二进制测试。与ORB最接近的系统是[3],它提出了一个多尺度的Harris关键点和定向补丁描述符。该描述符用于图像拼接,并显示良好的旋转和尺度不变性。然而,我们的方法计算效率并不高。

3. oFAST:FAST键点方向

由于它们的计算性质,FAST特征被广泛使用。 但是,FAST功能没有定向组件。所以在本节中,我们添加了一个有效计算的方向。

3.1. FAST 探测器

我们从图像中检测FAST点开始。 FAST采用一个参数,中心像素与围绕中心的圆环中的像素之间的强度阈值。我们使用FAST-9(圆半径为9),性能好。

FAST不会产生角度的测量,我们发现沿边缘具有较大的响应。我们采用哈里斯角度测量[11]以此来命令FAST关键点。对于目标数量N的关键点,我们首先将阈值设置得足够低以获得超过N个关键点,然后根据哈里斯度量进行排序,并选择顶点N个点。FAST不产生多尺度功能。我们使用图像的比例金字塔,并在金字塔的每个级别生成FAST功能(由哈里斯过滤)。

3.2. 强度中心方向

我们的方法使用角度方向的简单但有效的方法,即强度重心[22]。强度重心假定角的强度偏离其中心,并且该向量可用于估计方向。Rosin将贴片的时刻定义为:

(1)

在这些时刻,我们可以找到重心:

(2)

我们可以从角点中心0到矢量构造一个矢量, OC。补丁的方向只是:

= arctan2(m01,ml0) (3)

其中atan2是arctan的象限感知版本.Rosin提到考虑到角落是黑暗还是光明;然而,为了我们的目的,我们可以忽略这一点,因为角度测量是一致的,而不管拐角类型。

为了改善这种测量的旋转不变性,我们确保使用x和y计算剩余在半径r的圆形区域内的时刻。我们经验性地选择T作为补丁大小,使得x和y从[-r, r]。当ICI接近0时,该措施变得不稳定;在FAST角落,我们发现很少见。我们比较了质心法和两种梯度法测量BIN和MAX。在这两种情况下,在平滑图像上计算x和y渐变。MAX选择关键点补丁中最大的梯度; BIN以10度的间隔形成梯度方向的直方图,并选择最大仓。 BIN类似于SIFT算法,虽然它只选择一个方向。模拟数据集中的方向(面内旋转加上附加噪声)的方差如图2所示。梯度测量都不是非常好的,而即使在较大的图像噪声下,质心也能得到均匀的取向。

图2.旋转度量 与直方图(BIN)和MAX方法相比,强度重心(IC)在恢复人造旋转噪声贴片的取向方面表现最佳

4. rBRIEF: 旋转感知简介

本节中,我们首先介绍一个引导的简要描述符,显示如何有效地计算它,并展示为什么它实际上表现不佳。 然后,我们介绍一个学习步骤,找到较少关联的二进制测试,导致更好的描述符rBRIEF,为此我们提供了与SIFT和SURF的比较。

4.1. BRIEF运算符的高效旋转

BRIEF的简介

BRIEF描述符[6]是由一组二进制强度测试构成的图像补丁来描述。考虑一个平滑的图像补丁p。 二进制测试由以下定义:

(4)

其中p(x)是点x处的p的强度。 该特征被定义为n个二进制测试的向量:

考虑了许多不同类型的测试分布[6]。 这里我们使用最好的表演者之一,高斯分布在补丁的中心周围。 我们还选择矢量长度n = 256。在进行测试之前平滑图像很重要。 在我们的实现中,使用整体图像实现平滑,其中每个测试点是31times;31像素补丁的5times;5子窗口。 这些是从我们自己的实验中选出的,[6]中的结果。

BRIEF的转向

我们想允许Brief不变地进行平面旋转。 Brief的匹配性能在平面内旋转超过几度时急剧下降(见图7)。 Calonder [6]建议为每个补丁的一组旋转和透视曲线计算一个简要描述符,但是这个解决方案显然是昂贵的。 一个更有效的方法是根据关键点的方向来引导“简”。 对于位置(Xi,Yi)的n个二进制测试的任何特征集,定义2 x n矩阵

图3.特征向量平均分布:简要说明(第4.1节)和rBRIEF(第4.3节)。X轴是平均值为0.5的距离

使用贴片方向和相应的旋转矩阵,我们构建了S的“转向”版本:

现在转向的BRIEF运算符变成了

我们将角度离散到27r / 30(12度)的增量,并构造一个预先计算的Brief模式的查找表。 只要关键点方向e在视图中是一致的,则将使用正确的集合来计算其描述符。

4.2.差异和相关性

BRIEF的一个令人愉快的属性是每个位特征具有很大的方差和0.5附近的平均值。图3显示了在100k个采样关键点上256位的典型高斯简图模式的均值扩展。 0.5的平均值给出了一个位特征的最大样本方差0.25。另一方面,一旦简要沿着关键点方向定向以给出转向简介,则该手段转移到更分布的模式(再次,图3)。理解这一点的一个方法是,面向角的关键点对二进制测试呈现出更均匀的外观。

高方差使特征更具歧视性,因为它对投入产生差异性的反应。另一个理想的属性是使测试不成立,因为每个测试都将有助于结果。为了分析简介矢量中的测试的相关性和方差,我们研究了对于简要和引导的100k关键点的响应。结果如图4所示。使用PCA对数据​​,我们绘制最高的40个特征值(之后两个描述符收敛)。简介和引导简介展示了高初始特征值,表明二进制测试之间的相关性 - 所有信息都包含在前10或15个组件中。由于特征值较低,因此方向性方差显着较低,因此不具有歧视性。显然,Brief取决于关键点的随机取向以获得良好的性能。转向简介的效果的另一个观点显示在内在和异常值之间的距离分布(图5)。请注意,对于指导性的简介,异常值的意思是向左推,而且与内部变量有更多的重叠。

图4.三个特征向量的100k关键点PCA分解中特征值的分布:简介(第4.1节)和rBRIEF(第4.3节)。

图5. 虚线表示关键点到异常值的距离,而实线表示三个特征向量之间的距离:简要说明(第4.1节)和rBRIEF(第4.3节)。

4.3.良好学习的二进制功能

为了从转向简介中的方差损失中恢复,并且为了减少二进制测试之间的相关性,我们开发了一种用于选择二进制测试的子集的学习方法。 一种可能的策略是使用PCA或其他一些维度降低方法,并从大量二进制测试开始,识别256个具有高差异性且在大型训练集上不相关的新特征。 然而,新特性是由更多的二进制测试组成的,它们的计算效率比转导的简便程度要低。 相反,我们搜索所有可能的二进制测试,以找到两者都具有高方差(并且意味着接近0.5),以及不相关。

方法如下,我们首先在PASCAL 2006设置[8]中,从图像中提取了大约30万个关键点的训练集。 我们还列举了从31 x 31像素补丁绘制的所有可能的二进制测试。每个测试是补丁的一对5 x 5子窗口。 如果我们注意到我们的补丁的宽度为Wp = 31,测试子窗口的宽度为Wt = 5那么我们有N =(Wp – Wt)2可能的子窗口),我们想从这些子窗口中选择两个 ,所以我们有二进制测试,我们消除了重叠的测试,所以我们最终得到M = 205590可能的测试,算法是:

1.对所有培训路径运行每个测试。

2.按照距离平均值0.5的顺序排列测试,形成矢量T.

3.贪婪搜索:

(a)将第一个测试放入结果向量R中并将其从T中删除。

(b)从T进行下一个测试,并将其与R中的所有测试进行比较。如果其绝对相关性大于阈值,则将其丢弃; 否则添加到R.

(c)重复上一步骤,直到在R中有256个测试。如果少于256个,请提高阈值并重试。

该算法是贪婪搜索一组不相关的测试,手段接近0.5。 结果称为rBRIEF。 rBRIEF在转向简介中的方差和相关性有显着改善(见图4)。 PCA的特征值较高,并且快速下降。 有趣的是看到算法产生的高方差二进制测试(图6)。 在未经验证的测试(左图)中存在非常显着的垂直趋势,其高度相关; 学习的测试显示出更好的多样性和较低的相关性。

4.4.评估

我们使用两个数据集来评估oFAST和rBRIEF(我们称之为ORB)的组合:具有合成面内旋转和添加的高斯噪声的图像,以及从不同视点捕获的纹理平面图像的真实世界数据集。 对于每个参考图像,我们计算oFAST关键点和rBRIEF特征,针对每个图像500个关键点。 对于每个测试图像(合成旋转或现实世界的观点变化),我们做同样的,然后执行强力匹配以找到最佳对应。

图6.通过考虑在方向上的高方差(左)和运行学习算法以减少相关性(右)产生的二进制测试的子集。 注意测试围绕关键点方向的轴线的分布,该方向向上。 颜色编码显示每个测试的最大

全文共14476字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144577],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。