二阶极谐变换对图像不变量的表示外文翻译资料

 2022-12-12 17:14:37

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


二阶极谐变换对图像不变量的表示

Pew-Thian Yap, Xudong Jiang, Senior Member, IEEE, and Alex Chichung Kot, Fellow IEEE

摘要

本文介绍了一组基于正交投影基的二维变换,以产生一组不变的旋转特征。我们称这些变换为极谐变换(PHTs)。不同于著名的泽尼克和伪泽尼克矩,极谐变换的核计算是非常简单的,没有任何的数值稳定性问题。这意味着极谐变换包含正交性和不变性的泽尼克矩和伪泽尼克矩的优点,且不受其固有的局限性。这也意味着极谐变换非常适合于在需要最大判别信息上的应用。此外,极谐变换在寻求对于特定应用的最佳鉴别或代表性特征过程中为进一步特征选择提供了大量特征。

关键词:极谐变换;旋转不变;泽尼克矩;伪泽尼克矩;正交矩

1绪论

人们总是毫不费力,能够认识到各种各样的物体,不论其旋转。人造感知系统常常被设计来模仿这种基本能力。实现这一目标的方法之一是通过训练一组特定的分类识别对象平行工作,以满足不同角度的有限集合。另一种方法是直接设计一组功能是不变的图像方向。本文中,我们遵循后一种方法。

许多旋转不变特征在文献中已经被提及了。其中最受欢迎的泽尼克矩(ZMS)[1],还有经常同时提及的伪泽尼克矩(PSMS)[2]。这些矩已经非常成功地应用在各种环境,包括,但不限于,建模的角膜表面[3],水印[4],人脸识别[5],字符识别[6],多光谱纹理分类[7],和边缘检测[8]。尽管它们很有用,这两种矩也经常遇到计算困难的问题,特别是在计算高阶矩时。这些矩的计算问题固有地与许多因子项涉及计算矩内核的过程相关。旋转不变特征的其他选项包括旋转力矩(RMS)和复杂矩(CMS)。然而,这些矩与ZM和PZM一样也是不正交的。不正交性意味着每个计算时刻的信息紧密度不足。

旋转不变特征的其他选择包括转动矩(RMS)[ 2 ]和复数矩(CMS)[ 9 ],[ 10 ]。然而,ZMs和PZMs不是正交的。不正交意味着缺乏每个计算矩中的信息紧性。另一方面,内核的正交性意味着一个图像被投影到一组成对的正交轴,因此,分类器可以是相对简单的。内核ZMS和PZMs可以证明是Gram的结局施密特正交化在CM内核[ 9 ]。参考[ 11 ],[ 12 ],[ 13 ],[ 14 ]的全面研究的矩。

另一方面,内核的正交性意味着将图像投影到一组成对的正交轴上,因此分类器可以相对简单。 ZMs和PZMs的内核可以显示为CM内核上的格林施密特正交化的结果。

在本文中,我们介绍一组变换,称为极谐变换(PHTs),可用于产生旋转不变特征。与ZMs和PZMs相比,PHTs内核的计算非常简单,因此可以更快的执行。使用PHTs,也没有像ZMs和PZMs一样的数字不稳定性问题。PHTs可以预先计算和存储PHT内核的大部分计算。最后,对于每个像素,只需要三次乘法,需要一个加法运算和一个余弦和/或正弦估计来获得最终的核值。在本文中,将介绍三种不同的变换,即极复杂指数变换(PCET),极余弦变换(Polar Cosine Transform,PCT)和极正弦变换(Polar Sine Transform,PST)。我们将它们统称为极谐变换,因为这些变换的内核本质上是谐波,也就是它们是基本波。

我们的框架的另一个优点是提供了构建无限数量的可能性特征.为了能够有效地识别物体,除了构造不变对象描述符,一个也有产生的问题足够数量的功能,这是经常需要的

通过许多识别任务。更多的类必须歧视,更多的功能可能是必要的。因此,一个机制是必要的,能够产生一个大不变特征数,不一定需要具有物理或几何意义。

据我们所知,和我们的工作最相似是Ren等人的径向谐波傅立叶矩[ 15 ](RHFMS),其中数也用于形成径向核。而在表面上,他们的时刻可能非常类似于转型PCT特别是太平洋标准时间,我们要提出,不是很难观察到我们的表述是根本的与以下方式不同:1)Ren等人配方没有DC项,其存在可能对某些应用程序有用; PCET和PCT有DC项目,2)其公式在r = 时是有问题的因为需要计算1 )PCT和PST有在频率分量方面有更多变化PCT和PST的内核的基本频率为代替的Ren等人的公式。在第2节中,我们将定义极谐变换,其属性将在第3节进一步讨论,我们将在第4节中描述一些我们进行的实验结果。

2 极谐变换

图像的PCET就是将图像映射到一组基函数上得到的,这组函数称为PCET的基,记为:。这组基构成了单位圆内的一组完备正交集,其定义如下:

, (1)

其中n,l均为整数,r,分别为极坐标下像素的半径和角度。

在极坐标下的图像的PCET定义如下:

(2)

其中表示的复共轭,n,l分别为阶数和重复度,且|n|=|l|=0,1,...,。

具有正交性,且满足如下关系:

(3)

其中

并且同时: (4)

图1给出了核心的一些直观说明。(2)中的因子是为了规范核心,如果内核是正交的,则可以舍去,即让:

(5)

图1 (a)PCET核的3D视角,(b)PCET核的二维视角,其中n=0,1,2 =0,1,2

因此:

(6)

极复指数变换的系数可以通过贝塞尔不等式来划界:

(7)

类似于极复指数变换,我们可以定义另外两种变换:

极余弦变换(PCT): (8)

极正弦变换(PST): (9)

且:,

(10)

(11)

上述变换的极性部分在有限的区间上具有与傅立叶余弦和正弦变换非常相似的定义,分别满足偶函数和奇函数。因此,它们也与离散余弦变换(DCT)和离散正弦变换(DST)的定义非常相似。然而,应该指出的是,PCT / PST与二维离散余弦变换(2D-DCT)和二维离散正弦变换(2D-DST)基本不同,因为后者是在笛卡尔坐标中定义的,而前者在极坐标中定义。与PCT / PST相比,2D-DCT / 2D-DST也没有等效的旋转不变性。 PCT / PST和PCET之间的区别在于前者仅使用余弦/正弦函数,而后者则使用余弦和正弦(以复指数的形式)。应该注意的另一个区别是,PCT / PST在其径向核中覆盖的角度范围,即,是PCET的一半,即。事实上,PCET和PCT / PST的内核都是谐波,它们都是基本波。然而,我们要把前者PCET和后者PCT / PST区分开来。因为 PCET,PCT和PST,虽然形式相似,但是捕获的图像信息是不同的,这一点将在后面部分的实验结果中体现。在本文的以下部分中,我们将主要集中讨论PCET,偶尔在必要时引入PCT / PST。这是为了避免不必要的重复,因为PCT / PST本质上与PCET有许多相同的特性。

Bhatia and Wolf[1] 已经证明,一个多项式围绕原点进行任何旋转,其形式不变,且必有:

这里是的阶径项多项式,有一些矩它们的核满足这种形式,称为泽尼克矩。其径向核定义如下:

(12)

伪泽尼克矩是泽尼克矩的一种变化形式,其径向核定义如下:

(13)

正交傅利叶梅林矩:

(14)

(15)

傅利叶梅林描述子:

(16)

旋转矩:

(17)

极谐傅利叶矩:

(18)

在列出的这些矩中,泽尼克矩,伪泽尼克矩,正交傅利叶梅林矩(OFMM),极谐傅利叶矩(RHFM)和极谐变换都是正交的,因为它们的核满足正交条件类似于(3)。另一方面,傅利叶梅林描述子(FMDS)和旋转矩是非正交的,不满足正交条件。基于正交内核的特征在信息紧凑性方面更加有效,因为图像被投影到成对正交的一组轴上,因此信息的重叠是最小的。还要注意,ZMS,PZMS和OFMMS的核计算涉及到计算多个因子项,这不可避免地导致这些时刻的数值稳定性。使用递归方程[2]代替这些公式,虽然递归公式确实有助于推出可计算矩的最大阶数,但是它们最终将受到数值不稳定性的影响。表1给出了各种矩与极谐变换矩的正交性和数值稳定性的总结。

表1 不同矩的对比-正交性和数值稳定性

3 极谐变换的性能

3.1 极谐变换的复杂计算

PHTs的核计算和ZMS,PZMS,OFMMS相比要容易的多。基于(1),我们可以用以下形式对PCET的核进行重新定义:

(19)

我们可以看到,这种形式下的计算并不复杂:变换后图像坐标只需要估计一次,然后以的形式存储,比之前就多了一个步骤。其余的只是这些存储值和之间的乘法,最后用三角函数的形式来对复指数函数进行估计,即:。因此,对于每个像素,只有三的乘法(假设的值是预先计算和存储的),另外,还有对一个正弦和余弦(复指数)的估计需要通过最后的核值来得到。这意味着PHTs具有提供构建数千种特征的可能性的附加优点。实际上,为了能够识别图像,除了图像不变量的描述符问题之外,产生大量特征的问题也是不可避免的。越多的种类需要区分,对于识别来说更多的特征就显得越必要。因此,需要一种机制,能够产生大量的不变特征,它不一定要有物理或几何意义。

3.2存储

PHTs核的易于计算也减少了存储核所需的存储空间。对于ZMS,如果需要ZMS的n个项,我们通常要存储n个不同的ZMS核,如果避免高价的ZMS的核的重复计算。但是另一方面,我们看到,对于PHTs,预先计算和存储核是没有必要的,因为到达核所需的计算量非常小。 根据我们在3.1节的讨论,我们只需要存储图像的映射坐标,这样任何程序的核都可以在没有太多麻烦的情况下进行计算。 这意味着N次在存储空间方面更加节省。

3.3信息的提取和零点数

ZMS和PZMS的径向核是多项式,零点的个数与描述图像的高空间频率分量的多项式的性能一致。 很容易看出ZMS的径向核在区间内有个重复根,除了特例当r = 0的时候。另一方面,对于PCET的径向核, 写作以下形式:

(20)

我们可以观察到实部和虚部分别具有2n和2n 1(包括r = 0的时候)个零点。 因此,要想有相同数量个零点,ZMS径向多项式的零点数必须是,这比PCET(大约是)要高很多。

3.4抑制问题

ZMS的径向核的零点分布在距离原点径向距离为r的区域。另一方面,PCET的核的零点几乎均匀地分布在区间内。阿布·莫斯塔法和索尔蒂斯在其论文中将复杂矩的核的零点的不均匀分布作为抑制问题。 我们这里用同样的术语来描述ZMS所遇到的类似问题。 抑制问题导致对图像的某些部分不必要的强调,而对其余部分的疏忽。图(2)说明了这一点。

图(2)

(图a可以看出ZMS的核将太多的重点放在信号的某一部分,而PCET的核则不会发生此类问题。图b和图c则分别为PCET核的真实分布和假想分布。沿着曲线的数字表示径向分布的n次)

3.5旋转不变性

PHTs的系数具有旋转不变性的固有特性。如果图像通过a顺时针旋转度变成,如果将更正式,这里:

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[27184],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。