基于空谱弹性网超图学习的高光谱非监督分类外文翻译资料

 2022-12-10 16:13:36

英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


基于空谱弹性网超图学习的高光谱非监督分类

王素娟,孙玉宝,韩仁龙,刘青山,袁晓彤

江苏大数据分析技术重点实验室,信息学院控制,南京信息工程大学,南京210044,中国。

(收到00月20XX;接受00月20XX)

在本文中,一个新的空间光谱局部性约束弹性网超教学习模型被提出用于无监督的高光谱图像分类。为了利用高光谱图像中的像素之间的空间光谱相关性首先通过从中选择K个相关像素构造局部约束字典一个空间邻域,激活最相关的原子和抑制不相关的。其次,每个像素被表示为的线性组合字典中的原子。然后,基于所获得的表示,计算像素并且将它们最相关的像素用于构造超边,这可以有效地捕获像素之间的高阶关系。最后,有一个为无监督学习而建的超图拉普拉斯矩阵。实验使用两个已经被广泛使用的超光谱图像,结果表明所提出的方法与其它现有技术相比,能实现优秀的分类。

关键词:高光谱图像分类,超图,弹性网,局部约束字典,分组,无监督学习。

1.介绍

自二十世纪下半叶遥感成像技术在这两种理论中都取得了巨大的进步。高光谱成像技术的出现无疑是这些发展中的一个突出方面,这使得以足够的波长分辨率来测量地球表面的反射能量变得可能。捕获的高光谱图像(HSI)展示的是三维立方结构(即,两个空间维度和一个光谱维度)(Baassou et al。2012)。HSI中的每个像素通常有数十到数百个各种光谱波长的反射率值。 换句话说,每个像素中的反射率值是可以进行比较和绘制的波长的函数。 这种情节通常被称为“光谱响应曲线”或“光谱特征”。每种材料都具有特定的特征。 因此,可用于材料分类。

相关工作:HSI分类是一个非常具有挑战性的问题,因为它在采集过程中的高维度,非线性和各种烦人的退化。在过去的几十年中,已经提出了许多算法来解决这些问题。最广泛使用的方法是监督分类模型,如神经网络,支持向量机等。受监督的方法(Sun et al。2014)以不同光谱特征的类别标签的形式假定了先前的知识。为了获得可接受的结果,每类的训练样本数量被建议为输入图像带数的10倍(Jensen和K. 1987)。然而,收集适当的培训样本对于 HSIs来说是非常困难和昂贵的(Zhang and F. 2012)。因此,当仅存在少量训练样本时,可以使用高光谱数据特征(如统计特性,多重结构等)的无监督方法似乎是一些有监督的学习方法的有吸引力的替代方法。

聚类是无监督HSI分类的主流方法。 K-means(Macqueen 1967),迭代自组织数据(ISODATA)(Ball和J. 1965)和Fuzzy c-means(FCM)(Bezdek 2013)是一些常见的聚类方法.ISODATA进行K-means聚类结果。它不需要提前知道簇的数量,但是如果数据没有以结构化的方式组织,那么这可能是耗时的,使得一些采样点分散簇间距离大,簇内部距离小。与K-means算法不同,FCM允许每个数据点同时属于两个或更多个簇。根据其到集群中心的距离,将成员资格值分配给每个数据点。在聚类精度方面,FCM通常比K-means算法更好,特别是对于具有非常相似特征的不同类的一些样本的情况。这些算法的一个重要方面是计算像素与生成的聚类中心之间的相似度。由于像素的高维数和HSI中的噪声损坏,许多研究人员试图使用特征提取方法作为相似度计算之前的预处理步骤,包括主成分(PCA),局部保留投影(LPP)(He和P 2003),线性判别分析(LDA)(Bandos,L.,and G. 2009; Hang et al,2015,2017)等。Yan et al。提出了一个图表嵌入模型将上述特征提取方法统一到一个共同框架中(Yan et al.2005)。

基于图的聚类方法也针对HSI无监督分类进行了全面的探索。这种类型的方法将每个像素作为顶点,并且采用光谱特征作为与顶点相关联的特征。如果两个顶点密切相关,则边缘将被链接。如何找到邻点并计算其相似度是基于图形的聚类的两个关键组件。最近K邻域(KNN)图和r邻域图是图形构建的两种流行方法。然而,他们都没有考虑到HSIs数据点之间的分布特征和内部关系。近年来,使用稀疏表示法进行图形构建的新模型,称为l1图(Cheng et al.2010)及其变体(Gu和K.2012; Huang et al.2015)已经探索到HSI分类。在这些模型中,每个样本通过求解一个约束最小二乘重建问题的剩余样本稀疏地表示。表示中的K个最突出的样本被选为其邻居,并且它们通过权重表示系数的成对边缘链接。

众所周知,HSI在像素之间具有高的空间上下文相关性,即,空间邻域中的像素属于具有高概率的相同类(Soltani-Farani,R.,andA。2015; Wang,M.,and S 。2014; Li et al.2014)。关闭空间相关性表示多个像素之间的高阶关系。预期相似的像素都被收集以表示中心像素。对这种上下文信息的挖掘对于HSI分类是有用的。然而,l1图倾向于从一组高度相关的一组中仅选择一个变量并忽略其他因素,因为l1对每个变量进行独立处理(Liu et al。2016)。同时,它只考虑两个顶点之间的成对关系,不能代表数据的复杂关系。与成对图相反,超图是图的一般化,其中每个边(称为超级)能够连接两个以上的顶点(Schuml;olkopf,J.,and T. 2007)。换句话说,超类可以是具有相似特征的顶点的子集,从而可以有效地表达高阶关系。

我们的工作:为了解决上述问题,我们提出了一种用于HSI聚类的空间光谱局部约束弹性网络超图学习模型。这项工作的灵感来自于刘琦等。(Liu et al.2016)提出了一种用于图像聚类的弹性网络超图学习模型。我们对l1约束添加了一个l2惩罚,以一起选择高度相关的样本,并包含这些选择样本作为一个超集,从而可以有效地表示高阶相关性。与l1图和弹性网超图不同,我们的算法首先构建弹性网络表示的空间光谱位置约束字典。这个字典可以激活最相关的原子并抑制不相关的原子。l1图和弹性网超图总是将整个样本集作为所有样本稀疏分解的字典。事实证明是非常有问题的,像复杂的计算,很容易从不同的类别中选择样本来构建它们的分解字典。在获取构造的字典后的每个样本的表示,我们取中心数据和最多相关像素在其表示中作为一个超集。超叠加权由两个像素之间的相似相似之和计算。最后,建立了弹性网超图拉普拉斯矩阵进行分类。所提出的方法的流程图如图1所示。

图1:所提方法的流程图

2.超图模型

图形模型是一种非常有效的工具,可以用于学习隐藏在数据中的结构和关系。 通常,具有类似特征的两个数据点将通过边缘来链接。 然而,成对边不能表示数据的高阶关系。为了解决这个问题,提出了超图模型。

超图G通常由一组对象V,一个超类E的簇和超边的权重矩阵W组成。每个超边对应于权重w(ei)。 如图2所示,超图的主要优点是一个超边连接可以链接多于两个顶点。 G的连通性结构可以表示为入射矩阵, 其元素是二进制变量(见图2(c)),定义为

(1)

顶点的度可以表示为

(2)

超边的程度可以表示为

(3)

与传统图形模型相比,超边的构造和超边权重的计算是超图像学习的两个关键问题。 当前广泛使用的K-最近邻(KNN)超图和r-邻域超图,它们通常具有统一的邻域大小,因此它们不是数据自适应的。

图2:(a)每个边仅由两个数据点组成。 (b)每个超边都由一个椭圆表示,并由至少由两个数据点组成。 (c)超图G的发生矩阵H

3.HSI分类的弹性网络超图学习

在本节中,我们提出了HSI分类的空间光谱局部约束弹性网络超图学习模型。 一个地方约束用于字典建设。 同时,考虑到HSI在像素间的高空间相关性,我们整合了空间和特征信息来计算两个数据点之间的相互关系。 权重被计算为该超边中的两个数据点之间的相互亲和度的总和。将HSI作为矩阵,其中是第i个像素,d是光谱带的数量,n是像素数。具体思路介绍如下。

(1)局部约束字典制定:我们首先在循环窗口T中选择最多的K个相关像素来生成局部约束每个像素的字典。 字典可以表达为:

(4)

其中是对角矩阵。如果包括在字典中,则,否则。选择最相关的像素作为原子,其他的被丢弃,这有助于减少包括在字典中的其他类的像素的比例。 与此同时, 在提出的局部约束字典上表示HSI像素可以避免在整个图像中的穷尽搜索并减少计算时间。

(2)弹性网组表示:获得每个像素的后,我们通过以下方式寻找样本集X的弹性网络组表示:

(5)

其中是字典上的的表示系数,是系数矩阵。 HSI像素可能遭受测量过程中的破坏,例如噪声,错过的条目和异常值。是用于表示X的分离误差部分的矩阵。lambda;是正则化参数。是规范很容易找到方程式

(5)相当于分别求解每个样本的。 目标函数对于的弹性网表示可以表示为:

(6)

方程(6)是一个典型的弹性网模型,如(Hui和Trevor 2005)。 在处理完整个样本之后,我们可以得到系数矩阵Z.

(3)超边构造:Z中的每个列描述了第i个样本和其余样本之间的关系。 这里我们将其与空间信息相结合,得出任何两个样本之间的相互亲和度,其可以表达如下:

(7)

其中是像素和像素的空间距离。 许多实验表明,alpha;= 1,beta;= 140是最佳选择。 基于这个定义,入射矩阵可以定义为:

(8)

其中theta;是一个小阈值,可以设为的平均值。是相互关联矩阵M的第j列向量。它由顶点和剩余n-1个顶点之间的所有关系组成。 可以看出,仅由几个具有突出的非零的样本形成。 然后可以如下计算超重权重

(9)

(4)超图谱聚类:给定构造的超图模型,设计一个超图谱聚类,用于HSI分类。 如(Bolla 1993;Rodrıguez2003;Schuml;olkopf,J.,and T.277)所述,归一化超图拉普拉斯矩阵首先被定义为:

(10)

其中,和W分别是包含顶点度d,超边度delta;和超边权重w的对角矩阵。 其次,我们计算特征向量,对应于前k个最小的非零特征值。 然后,我们将C的每一行视为数据点,并使用FCM算法将它们聚类为k组。 最后,如果矩阵C的第i行被分配给第j组,我们可以通过向聚类j分配来获得类标签向量f。

基于上述分析,在算法1中以无监督的HSI分类方法为基础对空间光谱局部约束弹性网超图模型进行了总结。

算法1:HSI分类的建议方法(ENHL)

输入:数据矩阵X,参数lambda;,beta;,gamma;,alpha;,beta;,theta;。

输出:类标签向量f。

1将所有样本归一化为零均值和单位长度。

2通过KNN为每个像素准备字典。

3通过求解以下优化问题获得系数矩阵Z:

4根据等式(7)计算相似度矩阵M:

5设置弹性网超图的关联矩阵H:如果,则,否则。

6计算超边的权重ej:顶点度:

和超边度:

7计算拉普拉斯矩阵L并找到其前k个最小特征向量表示为。

8将C的第i行表示为,使用FCM算法将中的点划分为k个簇。

9如果将矩阵C的第i行分配为第j个集群,则将分配给标签j。

10返回类标签向量f。

4.实验与讨论

为了评估我们提出的方法(ENHL)的有效性,我们将其与用于HSI分类的一些其它方法进行比较:FCM(Bilgin,Erturk和Yildirim 2008)对原始像素进行,PCA-FCM使用PCA来降低维度(Rodermel和Shan 2002),然后将FCM应用于聚类分析,基于光谱空间相似性的图谱聚类(SS-图)(Grauman和Darrell 2006),基于光谱空间相似性的超图谱聚类的相互亲和性的简单相互亲和力计算(ENHL-SM)的弹性网超记录学习,而不使用它们的空间信息。它们在两个真实世界的HSI上进行测试,并通过每个类别的分类精度,总体精确度(OA),平均精确度(AA)以及Kappa系数(kappa;)来评估。为了避免FCM聚类引起的任何偏差,所有算法重复10次。

4.1 数据集

用于实验的两个现实世界HSI数据被

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[27556],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。