英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料
高光谱图像异常检测的高阶张量统计算法
耿修瑞,孙康,姬璐艳,赵永超
中国科学院电子学研究所空间信息处理与应用系统技术国家重点实验室
清华大学地理系统科学系中心地理系统模型重点实验室
近来,高阶统计量在高光谱图像异常检测中已经引起越来越广泛的兴趣。然而,大多数提出的高阶统计异常检测方法都需要步进迭代过程,因为它们都是盲源分离(BSS)问题的直接应用。而且,这些方法通常产生多幅检测映射图像,而非单一的异常分布图。在这篇研究中,我们探索了协偏度张量的概念。并提出了一个新的异常检测方法——COSD(协偏度检测子)。COSD不需要迭代过程,并且产生单一的检测图像。基于仿真和真实高光谱数据的实验都验证了该算法的有效性。
高光谱数据的异常检测研究近来已经在许多领域引起广泛关注。所谓的异常检测,即在一幅目标和相关背景均未知的图像中找出异常的像素点。许多异常检测算法已经被提出。其中RX检测子(RXD)是最典型的一个。就异常检测而言,它已经被应用在多光谱和高光谱领域。事实上,RXD表达式等同于马氏距离。有许多从RXD中推导出的其他异常检测算子,例如修正RX(MRX)、归一化RX(NRX)、加权RX、随机RX和自适应随机异常检测算法(ACAD)。低概率检测算子(LPD)是另一个经常使用的算子。它依据图像任意像素与样本自相关矩阵求逆相乘所得的单位向量之间的关系来判断一个像素是否异常。统一目标检测算子(UTD)是其一个进化版本——它将图像平移变换到均值向量处。Kwon提出一个新的异常检测方法——对偶加窗特征分离变换异常算子(DWEST)。它包含两个局部窗口——外窗口和内窗口。设计的目的是为了将目标从背景中最大化分离。内窗口检测其中的异常目标,而外窗口用来对异常背景进行建模。通过移动这两个窗口,我们可以计算这两个窗口的局部均值和方差,并比较差异。因此,可以通过将不同窗口的差分均值投影到差分协方差矩阵的最大正特征值对应的特征向量上,从而提取到异常目标。类似于DWEST,NWEST在论文11中被提出,这一模型包含了三个局部窗口,即内、中、外窗口。前两个窗口用来提取相应的最大和最小异常目标。而外窗口用来对局部背景建模。而且,这一模型同上述两个模型的差异之处在于,它用正交投影收敛而非样本协方差矩阵的特征投影来作为衡量准则。基于一个非参数模型,联合F-检测算子被提出。这一方法的主要假设在于数据集是Fisher F分布的一个渐进行为,因此能够被一个公共的统计测试集检测。其他一些异常检测算法参考论文13-15。
上述提及的算子基本都是从统计的视角推导而来。其中包括一阶和二阶统计(样本均值向量和协方差矩阵)。然而使用这些统计量并不够充分,因为对于大多数真实图像而言,离散点的分布并不是正态分布。
SCIENTIFIC REPORTS | 4 : 6869 | DOI: 10.1038/srep06869 1
1
www.nature.com/scientificreports
在这篇研究中,三阶统计张量被引入,用于提取异常。事实上这里有很多文献中用到高阶统计量来进行异常检测。然而这些方法都是盲源分离方法的直接应用(如FastICA)。为了实现最优解,这些方法通常包括多步迭代,因此它们很容易陷入局部最优。为了解决收敛性问题,耿将协偏度张量的概念引入了高光谱图像中,并基于高阶奇异值分解提出了新的目标检测方法。然而,无论是基于盲源分离的方法,或者高阶分解的方法,在特征提取的领域,不仅会提取到图像的异常,还会包含图像的独立成分。
在这篇论文中,结合三阶统计量的概念和RXD的思路,我们提出了一个新的异常检测方法,称之为协偏度张量检测算子。提出的新方法能直接不经迭代获取到图像的异常分布,由此避免了盲选分离方法的缺点。
尽管有许多基于二阶统计量的异常检测方法,但它们大多是从RXD推广得来。类似地,我们也可以基于COSD推广出相应的算法。因此,这篇研究仅着眼于比较COSD,FastICA和RXD的优劣。为了更好地进行比较,在FastICA中我们用偏度作为非高斯性的指标。此外,因为FastICA可以产生许多独立成分,我们仅选取了具有最大偏度的一个方向作为检测方向的结果。
仿真数据的计算
仿真图像(两个波段,50times;50像素值)首次被用于该实验。仿真数据包括两部分——8times;8大小的异常目标和背景。背景像素值服从高斯分布。目标位于图像的左上角,并且在图像的特征空间随机发散在背景之外。
比较由图2给出。通过视觉比较分析,CKSD的表现优于RXD。图3展示了三个算法的检测率关于错误示警率的接收机操作特性曲线。明显地,COSD检测表现可以与FastICA相媲美,并且均优于RXD。
Fig. 1 | 仿真数据的散点图
真实高光谱数据的计算
来自OMIS-II的100times;100高光谱数据图像用于测试这些方法。高光谱图像系统由中科院上海科工局发展建立.这幅图像数据于2003年由航空遥感局在中国西安获取,包括从可见光到热红外的64个波段,其中在可见光和近红外区域的60个波段具有3.6米的空间分辨率和10纳米的频谱分辨率。在整个图内,有一些人为制造的小目标,主要分布在图像右上角的两个位置。(在图4中用长方形标出)。大概有十几个像素。从真彩色图像中,很难发现长方形小目标的任何信息。
从图4中我们可以看出,在右上角有两个小而明亮的方块,这就是我们人为产生的目标。它说明RXD可以从背景中区分出异常像素。图4.c是COSD的结果。其中两个人为产生异常像素被标亮,而剩余的被压缩为背景空间。图4.d NCOSD的结果说明仅仅利用偏度信息提取异常是足够好的。图5展示了ROC(接收机操作特性曲线)。它说明COSD的检测能力相比RXD有明显的优势。
现在,我们进一步比较FastICA和COSD。通常而言,FastICA经过迭代可以得到所有的独立成分,具有最大偏度值的被选择作为异常检测的结果。然而,由于局部优化问题,FastICA的第一成分并不总是对应于全局最大偏度方向,因此不同的表面目标会被检测到(图6展示了异常检测的不连续性。此外基于偏度的算法不具有全局收敛特性。然而,COSD不具有这些问题。)
讨论
在这篇研究中,我们提出了一个新的方法,它利用高阶统计张量来检测高光谱图像中的异常,并且详细分析了偏度张量在异常检测中的应用。相比于基于二阶统计量的传统方法,COSD对于提取异常目标具有更好的能力表现。而且,相比于传统的基于盲源分离的方
SCIENTIFIC REPORTS | 4 : 6869 | DOI: 10.1038/srep06869 2
www.nature.com/scientificreports
Fig.2 | 异常检测结果 (a) RXD; (b). FastICA; (c). COSD.
法,COSD能够直接利用高阶统计张量得到异常目标的分布。由于COSD不需要迭代,它能避免盲源分离方法的缺点。通过仿真数据的实验,表明COSD的检测表现优于RXD。高光谱真实数据的实验中表明COSD可以标
亮人工产生的目标,成功地将其从图像中作为异常提取出来。值得提及的是,由于一幅图像中异常像素的不确定性,获取的异常像素可能并不是我们感兴趣的其中之一。然而高阶统计张量的引入将在高光谱的异常检测中带来许多好处。
Fig.3 | ROC 曲线.
SCIENTIFIC REPORTS | 4 : 6869 | DOI: 10.1038/srep06869 |
3 |
www.nature.com/scientificreports
Fig.4 | 高光谱图像异常检测结果: (a). 真彩色合成图像 (b). RXD, (c). COSD, (d). NCOSD.
尽管如此,COSD可能会有很大的计算复杂度。图7展示了RXD和COSD的计算复杂度(借助浮点操作和跳变测量得到。假设高光谱图像的大小为N个像素,L个波段)。RXD需要的跳变是。而COSD是。从图7我们可以看出,COSD对波段的数目更为敏感,当L相对很大时(例如大于50时),COSD的计算复杂度是RXD的倍。
值得注意到,就公式表达来看,COSD方法可以视作是RXD的一个延伸,即从二阶统计量(协方差矩阵)到三阶统计量(协偏度张量)的推广,因此其他所有二阶异常检测方法(例如修正RX, 加权RX, 随机RX,DWEST, NSWTD)都可以轻易地推广到三阶或更高阶的统计量上。COSD算法在高光谱异常检测上的优势保证了这一延伸的灵活性。
总的来说,异常通常在高阶统计量中展示出较强的特征。因此,这篇论文基于三阶统计量提出了一个COSD的检测方法。正式来讲,COSD是RXD从二阶到三阶的一个延伸。重要的是,COSD利用了角度信息,从而保
证了COSD的有效性。
方法
RXD算子由Reed and Yu 提出。对于图像中每一个像素向量,RXD可以通过算子来完成:
其中是图像的均值向量。K是图像样本的协方差矩阵,N是像素的个数。等式一具有和马氏距离相同的形式,协方差矩阵K可以被分解为:, 其中,,E是K的特征向量矩阵,我们用作为图像的白化操作算子。接着,等式1可以被写成
从式2可以看出, 是白化图像的欧拉距离
张量引入
一个实数m阶n维张量A包含个实目录。表示为,其中。图8展示了一个三阶四维的张量。如果一个张量的目录元素在它们索引指数任意打乱的情况下保持不变,称张量A是超对称的。数学表示为:
Fig.5 | ROC 曲线
SCIENTIFIC REPORTS | 4 : 6869 | DOI: 10.1038/srep06869 |
4 |
www.nature.com/scientificreports
Figure 6 | 第一成分的不同结果.
Figure 7 |RXD、 COSD计算复杂性对比 (a)波段数 (N 5 200*200) and (b) 像素数(L 5 50).
张量A定义了一个m次齐次多项式
其中是一个m阶、n维、秩为1的张量。是A与的一个张量积。例如,当m等于2时,A是一个的矩阵。 对于m阶的张量,可以进行如下的m步分解
其中表示模i积算子。图9解释了三路张量和向量之间的乘法公式,并最终生成一个标量。正如之后看到的那样,如果A是一个协偏度张量,那么标量即为相应的偏度方向。
对于一个高光谱数据集它的m阶累积矩阵(张量)可以定义为:
其中,是图像的第i列向量。L是图像的波段数。明显地,m阶统计张量是一个超对称张量。这篇论文将集中研究,借助高阶统计张量进行高光谱图像的异常检测。协偏度张量检测算子对于高光谱数据集,假设均值向其中I是L*L单位矩阵。它意味着图像的每个波段具有单位方差。波段之间的互相关系数为零。这就是说,图像数据已经被归一化。满足这两个条件并不困难。如果图像的均值向量不为零,可以通过将原始图像平移到均值向量实现。此外,真实的高光谱数据通过数据白化也可以满足第二个条件。
这里,我们提出一个新的异常检测算子,称之为高阶
统计算子,定义如下:
其中是图像的高阶统计算子。r是图像的像素向量。类似于等式3,是m阶统计张量的张量积,在这篇论文中,我
全文共7338字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[144368],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。