英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料
快速SIFT实时视觉特征提取设计
Liang-Chi Chiu, Tian-Sheuan Chang(IEEE高级会员), Jiun-Yen Chen,
and Nelson Yen-Chung Chang
摘要——用尺度不变的特征变换(SIFT)来进行视觉特征提取已经广泛的用在目标识别上面了。然而,它的实时特征提取的实现时间还很长,因为用了冗杂的高斯模糊运算的运算水平的框架使得运算量巨大和需要高质量的存储器来搭配。因此,本文提出了一种类似用尺度不变的特征变换来处理整体图像,以及为了实现其实时应用需求而进行的硬件设计的特征提取流程。和原始的SIFT算法进行对比,本文提出的方法使得计算量减少了90%和内存使用量减少了95%。最终成果是实现使用90nm CMOS技术的580-K门数,来提供6000个特征点/帧VGA图像为30帧/秒和〜2000特征点/帧以100帧的时钟速率以30帧/秒的1920times;1080图像。
关键字——特征提取,SIFT,VLST设计
1.说明
视觉特征提取是计算机智能图像处理的关键技术,在提取技术中,尺度不变特征变换(SIFT)[1]是最广泛采用的方法,为可靠的物体检测提供了稳定的视觉特征点。SIFT检测并描述不同场景或不同角度的物体检测的图像中的局部特征点。这些特征点描述对象,用来抵抗帧失真诸如缩放,旋转,移动,改变透视,阴影和噪声的强度和方向。为了提供这些稳定点,SIFT在多个尺度计算涉及图像卷积与不同尺度的高斯滤波器,以及局部高斯差异的最大或最小值(DoG)模糊的图像。然而,这种算法的实时实现面临着沉重的挑战,因为其帧图像计算与图像上的迭代高斯模糊操作以及用于特征提取的模糊图像上的帧差分操作,使得其需要复杂的计算量,巨大的存储器存储和冗长的计算延迟。因此,需要一种快速算法及它VLSI设计。
手稿于2012年11月5日收到; 2013年2月19日修订;2013年4月19日接受,发布日期2013年4月24日; 当前日期版本2013年6月4日。这项工作得到了工业部门的支持
技术研究所授权A301AR3710。副主编Mark H.-Y. Liao教授协调对本手稿的审查,并批准出版。
L.-C. Chiu是PixelArt的工程师,联系方式是:新竹78229,台湾(电邮oboe.chu@gmail.com)。
T.-S.张先生毕业于国立交通大学电子工程系,新竹300,台湾(电邮:tschang@twins.ee.nctu.edu.tw)。
陈先生和N. Y. C. Chang是在台湾新竹工业技术研究院(电子邮件:itri990075@itri.org.tw;
本文中的一个或多个图形的彩色版本可从http://ieeexplore.ieee.org在线获取。
数字对象标识符是10.1109 / TIP.2013.2259841
SIFT以前的实现版本可以分为以下类别:多核,GPU或FPGA方法。多核[3],[4]或GPU方法[5] - [8]使用大量的并行计算资源来加快计算速度。作品[9] - [12]是在SIFT基于使用的FPGA平台并行FPGA资源加速高斯模糊。但是,相应的特征点计算仍然由处理器计算,结果使数据总线拥塞严重并降低其性能。除了上述实现方法之外,像SURF [2]的快速算法,使用积分图像概念来加速高斯模糊计算,其后是几个工作[13] - [15]。而积分图像显著减少了计算量。然而,所有这些方法仍然需要高斯模糊的迭代,这阻碍了它们在更大的帧大小和增加的特征点的数量上的实时应用。
为了解决上述问题,本文提出了一个具有整体图像的SIFT(LPSIFT)及其并行硬件设计实时应用需求的层次平行的方法。首先,为了避免由于帧级计算引起的长时间延迟,我们采用层并行重构盒内核来代替迭代高斯模糊操作。通过使用子内核和的积分图像方法进一步简化了盒内核的计算。这样,第一个特征点的等待时间从几个帧减少到几个图像行(取决于该特征点的位置)。对于关键点定位,我们将复杂的低对比度分析简化为低亮度测试。对于硬件设计,我们采用了即时特征提取流程,因此只能存储部分时间结果。此外,通过具有精确等效周期(PEC)的低成本通用运算单元来实现关键点定位中的昂贵的反平方根和分频器,以减少门数。通过上述方法,SIFT可以实现低实时高清视频的硬件成本。
本文的其余部分安排如下。 在第二节中,我们将简要介绍SIFT的运作。 在第三部分中,我们将介绍所提出的算法。 其相应的硬件设计见第四节。 然后,在第四节中,我们将展示实施结果和比较。最后,将在第五节作出结论。
II. SIFT概述
图1显示SIFT的整体算法流程[1],其中包括尺度空间极值检测,准确关键点本地化,方向分配和本地化图像描述符.
图1: SIFT算法:(1)尺度空间极值检测,(2)准确的关键点定位,(3)取向分配,(4)局部图像描述符
第一步,规模空间极值检测,识别关键点候选人 它首先卷曲图像高斯滤波器 GF(x,y,ksigma;)在不同的刻度上建立一个金字塔的高斯模糊图像。 其中,
Sk = S(x, y, ksigma;) = GF(x, y, ksigma;) lowast; Skminus;1 (1)
其中对于k = 1,Skminus;1 = S0 = I (x, y)是输入图像,
(2)
卷积图像按八度(八度)分组对应于sigma;的值加倍),k的值为每个八度音阶选择固定数量的卷积图像。每倍频程最高刻度的帧被下采样四个作为下一个八度音阶的输入帧,如图所示。 1.在本文中,我们将框架表示为高斯金字塔模糊图像的八度和比例,G [八度,比例]这个高斯金字塔可以定义如下:
G [0, 0] = I (x, y) : 原始框架 (3)
G [0, 1] = GF (x, y, sigma;) lowast; G [0, 0] (4)
G [m, k] = GF (x, y, ksigma;) lowast; G [m, k minus; 1] for m, k ge; 0 (5)
其中G [m,0]通过下采样G [m-1,最大k在八度]由四。然后,我们可以通过计算DoG模糊图像
DoG [m, k] = G [m, k 1] minus; G [m, k] (6)
使用DoG,我们可以通过比较3times;3窗口中的局部最大值或最小值作为关键点候选
相邻尺度的像素。
在候选人中,稳定关键点由本地化在低对比度和边缘检测测试的关键点定位步骤中拒绝一些不良关键点。 低对比度测试拒绝不稳定的极值位置,由以下公式定义:
(7)
具有从泰勒展开得到的低对比度阈值的DoG [m,k]
(8)
边缘检测由以下公式决定:
(9)
其中r是适应对象边缘清晰度的系数,Tr(H)和Det(H)是2times;2的轨迹和行列式黑森林矩阵:
(10)
(11)
(12)
基于上述测试,如果候选人被验证为特征点,则SIFT开始计算其方位分配。
在方向分配步骤中,分配每个关键点基于局部图像梯度的一个或多个取向方向实现旋转不变性。 其中,SIFT选择最大向量S向量来表示方向分配。 这些步骤确保图像位置的不变性,规模和旋转。 最后,在本地图像检测器步骤中,a计算每个关键点的描述符向量,使其成为高度独特的和部分不变的其他变化。
III.SIFT分析和拟议的LPSIFT设计A. SIFT设计分析
表I显示了SIFT参数的设计分析[octave,scale] = [2,4]。 在这个表中,A是像素数在一帧中,其第一级下采样帧定义为:
(13)
其中W和H是原始帧的宽度和高度。B表示特征点的数量。
从这个表中可以看出,尺度空间极值检测和关键点定位有助于大多数整体计算,并需要大量内存来保存中间数据帧。 另外,关键点定位,方向分配,并且本地帧描述符计算使用大量的分频器来计算泰勒展开正常化。 这使得硬件实现变得困难。因此,如何解决这些问题是一个重要的课题SIFT硬件设计。
SIFT硬件的另一个问题是其高度依赖数据的计算结构。 在SIFT的数据流中,新的尺度图像必须等待高斯金字塔中先前尺度图像的完成。 因此,不同尺度的图像依次计算。 这导致长延迟,并且禁止并行地进行以下DoG计算,同时需要至少三个比例图像来计算特征点的候选。 因此,这些中等规模必须存储图像才能完成DoG计算,这样可以大量的存储内存。
图.2. 提出的LPSIFT算法流程。
B.拟议的LPSIFT算法
图2显示了所提出的LPSIFT算法,即基于SIFT进行三大修改:快速的空间极高检测与层平行高斯金字塔和整体图像和简化的关键点定位亮度阈值。
在这个流程中,我们提出了一种层并行算法来解决数据依赖问题,这不仅可以同时计算高斯金字塔和DoG金字塔,而且可以同时计算关键点候选。 这种并行计算减少了从多个整个图像到几个图像行的存储和延迟。 为了在减少计算复杂度的同时进行并行计算,我们使用积分图像方法来创建一个具有与高斯滤波器类似的响应的盒内核,以保持特征匹配性能与SIFT相似,但没有复数高斯 过滤器。 通过在每个尺度上采用多个盒子内核的积分图像方法,我们大大降低了计算复杂度,并可以对所有尺度进行并行计算。
另一个问题是泰勒扩张的复杂性很高。我们提出一种低亮度方法而不是低亮度方法对比方法降低复杂度。
图3 层平行高斯金字塔的概念。
- 使用层并行高斯金字塔和积分图像的快速空间极限检测: 图3显示了层并行高斯金字塔的概念。 在原始的高斯金字塔中,每个新的金字塔级别取决于其以前的水平。 为了消除这种依赖性,我们可以完全扩展金字塔级别并将多个内核合并为一个通过这种独立的高斯滤波,我们可以并行计算所有尺度层,并根据需要生成DoG图像。
G [m, k] = GF (x, y, ksigma;) lowast; G [m, k minus; 1]
= (GF(x, y, ksigma;) lowast; GF(x, y, (k minus; 1)sigma; )lowast;GF(x, y, sigma;)) lowast; G [m, 0]
=
正整数m和k。 (14)
然而,如图3所示,合并的内核将变得更大,更多的内核被合并。这将需要高计算复杂性和存储。 为了解决这个问题,我们使用可以恒定时间计算这个大内核的整体图像概念。 通过使用整体图像,无论内核大小如何,我们只需要四点信息和三个补充,并减少大量的计算量。与这种简单的计算,我们可以并行计算所有的尺度层,而不用担心由于层并行计算造成的复杂性和存储性。
整体图像对于盒子内核最有效,但是盒子内核导致较差的匹配性能。 因此,我们使用重构的盒子内核来接近高斯滤波器的性能。 拿图4中的第一个5times;5盒子的尺寸。 4(c)为例。我们将这个简单的内核修改为图中的内核。 4(d)接近高斯滤波器的性能。 其积分图像的计算可以非常简单,如图1所示。 4(b)。 在本文中,我们选择盒子粒子的大小为5times;5,7times;7和3times;3,以适当的修改构造不同尺度的滤波器,如图4所示。
-
具有亮度阈值的简化关键点定位:SIFT使用泰勒展开来排除低对比度候选,但泰勒展开需要复杂的计算。 实际上,低对比度的候选人也几乎具有低亮
全文共12109字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[143300],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。