英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料
基于字典学习的低剂量X射线CT重建
摘要
虽然在许多疾病的早期检测和精确诊断中,影像诊断学提供了巨大的便利,人们越来越关注辐射引起的基因突变的潜在副作用,比如癌症以及其他疾病。因此,如何在减少辐射剂量的同时保持诊断性能是当今计算机断层成像(CT)领域的一个主要挑战。根据压缩感知理论,全变分(TV)最小化的稀疏约束也证明了小剂量CT重建的可能性。相对于TV方法中的离散梯度变化,字典学习是稀疏表示的一个更有效方式。另一方面,考虑小剂量CT重建的投影数据的统计性质也很重要。最近,我们已经研究出基于字典学习的小剂量CT方法。在本论文中,我们详细的介绍了这个方法并且用实验的方法进行评估。在统计迭代重建框架中,稀疏约束的冗余字典是纳入目标函数中的。字典可以在图像重建之前被预先决定,也可以在重建过程中自适应定义。最小化交替方案已经被用来最小化目标函数。我们已经在动物和人类的CT投影数据中评估过该方法,字典学习的完善已经被过滤的反向投影和基于TV的重建量化了。结果表明,在我们所选择的案例中,该方法将得到更低噪声和更多结构细节特征的重建图像。当然,我们还没有证明这个方法适用于所有的组织结构。
关键词:压缩感知(CS) 计算机断层成像(CT) 字典学习 小剂量CT 系数表示 统计迭代重建
1 绪言
如今,X射线计算机断层扫描成像(CT)已经被广泛的用在医院、诊所的诊断辅助。但是我们都知道,X射线的辐射很危险并可能导致基因突变,比如癌症以及其他疾病[1][2][3]。因此,辐射危害问题得到越来越多的关注,在医学界,著名的ALARA(as low as reasonably achievable)准则被用于避免过多的辐射剂量。然后,由于X射线成像的量子累积特性,信噪比正比于X射线剂量的二次方。考虑到其他的条件,减少X射线的剂量将降低图像质量。总的来说,在CT领域,如何以最少的射线剂量重建高质量的CT图像是正被热议的话题。
有两个方法可以减少射线剂量:第一个方法是减少每个探测器元素的X射线流量,第二个方法就是在整个重建过程中减少X射线衰减设备的数量。第一个方法通常用来调整X射线管的操作电压、操作电流和曝光时间,进而控制噪声投影。第二个方法通常会导致不完备的投影数据,造成较少的视图、受限制的视角、内部扫描或者其他问题。这些问题可能一起出现在一个数据集,是算法研究的一个主要挑战。
从有噪声的投影数据中重建图像,有几种重建算法可以选择。这些算法根据优化算法中的变量可以被分为两类。
第一类是图像重建之前预处理投影数据,其优化变量就是投影数据。Hsieh提出了自适应平衡均值滤波的方法,这种方法根据噪声的特点来调整滤波参数[4]。在此基础之上,Kachelriess等提出了多维自适应滤波方法,这种方法从探测器方向、视角方向和轴向方向三个方向重新定义了投影数据[5]。La Riviere提出了通过罚似然函数来平滑正弦图[6]。Wang 等提出了一种罚加权最小二乘法,用于减少正弦噪声[7]。
不同于上面这些预处理方法,第二类方法是统计迭代重建(SIR)。这种方法是根据投影数据的统计特性来优化最大似然函数或者罚似然函数,其优化变量是图像点像素或体像素。Kamphues和Beekman提出了以中国有序子集凸集算法[8]。Nuyts等提出了梯度上升算法[9]。Erdogan和Fessler提出了基于可分离抛物面替代算法[10]。最近,Thibault等将SIR方法应用于真实的多排螺旋数据中。这些结果表明统计框架可以从噪声投影数据中获得最优重建结果。
压缩传感理论变得流行起来,并且已经器械化用于不完备数据和高噪声数据的图像重建。压缩传感理论可利用比根据Shannon-Nyquist的采样定理计算所得更少的样本的稀疏信号来进行精确重建[12][13]。压缩传感理论成功的关键在于信号的稀疏性。一个对象往往不具有稀疏性,但是通过稀疏变换可以将其转换为能稀疏表示的信号。一个比较常用的稀疏变换就是离散梯度变换(DGT),其系数求和可得到全变分。根据压缩传感理论,各种各样的TV最小化算法被用来解决少视角成像和内部问题。例如,Chen等提出先验图像约束压缩感知算法用于动态CT重建[14]。Yu和Wang证明了分片常数的内部感兴趣区域可以用TV最小化方法重建[15][16]。Xu等进一步研究发展了CS理论,将内部断层成像公式变为统计迭代重建架构[17]。Ritschl等基于临床应用的ASD-POCS架构提出了改进的TV方法[18]。虽然这些基于TV的系列算法在很多实例中都能得到很好的结果,但TV最小化约束方法仍有很大局限性。第一,TV约束是描述全局的,不能直接反应成像对象的结构信息;第二,DGT离散化不能分辨真实的结构信息和图像噪声。总之,基于TV约束的图像重建可能丢失一些有效信息,并且在不完备数据和高噪声数据重建时可能会产生块状效应。因此,有必要去寻找更好的稀疏化方法用于CS图像重建中。
近年来,基于冗余字典的稀疏表示[19]在图像重建、图像分析和核磁共振图像领域越来越受到关注。字典是一组过完备基,基中的元素称为原子,根据具体的应用从图像训练样本集合中学习得到。然后目标图像可以由这些原子的线性组合稀疏表示。通常,目标图像被分解成许多相互重叠的图像块。字典在这些图像块中学习,重叠图像块相应的平均值依赖于给定的图像位置。由于字典从训练图像中不断学习,相比于其它的稀疏转换,具有更好的稀疏性。另外,原子的冗余性也增加了稀疏性。更重要的是,由于字典是基于图像块的,因此可以更好的捕捉局部图像特征,并且,在很多实例中,图像结构具有自相似性。
考虑到上述优点,基于字典的方法在图像/视频减噪、图像修复、脸部识别、文本分类、MRI和其它领域中得到更好的结果。2006年,Elad和Aharon用基于字典的K-SVD方法[20]解决了图像减噪问题。Mairal等将该方法用于彩色图像修复[21]。然后,他们又发展了基于多尺度框架的字典学习方法来进行图像和视频恢复[22]。Wright等则将基于字典学习的系数表示应用到人脸识别中[23]。在医学成像方面,基于字典学习的研究才刚刚兴起,主要集中在MRI 中。2010 年,Chen 等结合字典学习方法和基于TV最小化约束的重建框架来提高MRI 图像质量[24]。2011 年,Ravishankar 和Bresler 提出了自适应字典学习方法来从高度下采样的k空间数据中重建MRI 图像[25]。
本论文认为字典学习技术同样能应用于低剂量CT 重建中,且能产生很好的重建效果。因此,本章提出了一种基于字典学习的重建算法以解决低剂量CT 重建问题[26]。这种算法一方面通过统计迭代重建过程来实现投影数据保真性约束,另一方面使用基于字典的稀疏表达约束作为正则化方法[17]。其中的字典分为全局字典和自适应字典两种。前者是根据具体的应用,事先给定一组用来训练的样本图像块,从这一训练样本集中训练出字典,这一字典在CT 重建过程不变化;后者是从迭代重建过程的每个中间迭代结果中提取训练样本,在每次迭代重建过程中自适应的更新字典。
其余章节的内容简介如下:在第二章,我们介绍了字典学习和SIR的背景;在第三章,我们描述了重建方法及其可行性;在第四章,我们用临床前的和临床低剂量投影数据得到一些典型结果,并且比较了该方法和我们提到过的其它方法;最后,在第五章,我们讨论有关问题并对本文作出总结。
2 背景
2.1 字典学习和稀疏表示
设N和K为整数,R表示实空间,则字典表示为一个矩阵 ,它的每一列是一个N维向量,称为原子。通常,字典是冗余的(也称为过完备的),即Nlt;lt;K。一个图像块有个像素组成,可以表示成一个N维向量。若一个图像快x能被字典D中的原子的线性组合稀疏表示,则有:
(1)
式中:小的常数,表示误差上界;稀疏表达,仅含有较少个非零元素,,为范数。字典的冗余性表示原子的数目大于原子的长度。
寻找图像块关于字典的稀疏表达,等价于求解如下最小化问题:
(2)
使用Lagrange方法,则上式可写成为如下无约束形式:
(3)
式中:Lagrange乘子。选择一个合适的,式(2)和式(3)两个问题等价。由于直接求解式(2)和式(3)是一个NP难题,通常采用近似的办法,比如一些贪婪算法,如匹配跟踪(matching pursuit,MP)[27]和正交匹配跟踪(orthogonal matching pursuit,OMP)[28][29]方法等。另外,也可以用范数来代替范数,从而凸化上述问题,可以使用基追踪(basis pursuit,BP)[30]等算法对其求解。
给定一个由S个图像块组成的训练样本集,字典学习是指寻找一个字典从而使得训练样本集中的每个图像块可以由这个字典中的原子的线性组合稀疏表达。用矩阵表示给定的训练样本集合为,其中每个图像块为X的一个列向量,则相应的稀疏表达也可表示成一个矩阵,其中每个图像块的稀疏表达为的一个列向量。这样字典学习过程可表示为求解如下优化问题:
(4)
上式等价于如下两种优化问题:
(5)
(6)
式中:稀疏表达的稀疏度;稀疏表达的误差。式(4)—(6)中的范数可由范数代替而更易求解。关于字典学习有许多方法,包括经典的K-SVD方法[31]和快速的在线字典学习方法[32]等。
字典学习的一个经典应用是图像去噪[20]。设向量表示一个噪声图像,它由个像素组成,向量表示这一图像对应的去噪版本。从图像中可以提取一系列部分重叠的小图像块,比如,使用1 个像素的滑动距离,则可以得到个图像块。假设经过去噪后的图像所提取的图像块能够被字典中的原子稀疏表达,另外考虑到去噪后的图像应与原始图像尽可能的接近,图像去噪过程等价于如下最小化问题:
(7)
式中:表示从图像x中提取图像块的过程;正则化参数,与图像z的噪声水平有关。式(7)中的字典D可以通过两种方式来得到。一种是从训练样本图像集合中事先确定,这一训练样本集合中应尽可能多的包含图像的结构信息。另一种是在去噪过程中自适应的构造字典。
2.2 统计重建和目标函数
为了不失一般性,我们假设单能源,投影数据将近似地服从泊松分布:
(8)
式中:测量到的沿第i条路径的投影值;空扫描因子;是X射线线性衰减系数的积分;是系统矩阵;是成像对象的线性衰减系数图像;是背景噪声;I和J分别表示投影路径总数和像素点总数。
由于沿不同路径的投影数据相互之间是统计独立的,投影数据联合概率分布的对数似然函数[33]可表示为:
(9)
式中:概率函数;是的期望值。忽略常数项,我们可以得到:
从统计学的观点来看,图像重建过程可以被认为是最大化后验概率函数过程。根据贝叶斯准则:,并考虑自然对数操作的单调增性质,图像重建过程等价于最大化如下目标函数:
(10)
式中:表示对于图像的先验知识,即正则化项。设,则图像重建过程也可以表示为最小化目标函数:
(11)
对应用二阶泰勒级数展开,可得到在线积分的一个估计值[34],式(11)可变为:
(12)
式中:是每条X射线路径的统计加权。
当联合代数迭代法(SART)最小化一个最小二乘函数,SIR处理式(12)中定义的统计加权最小平方函数。统计加权表示沿每条路径的投影数据的权重,投影数据通过密集的投影路径时将有更低的信噪比(SNR)。统计加权都是通过物理实验测量得到的[7][35][36],在可行性研究中,我们在SIR中采用泊松单能源模型。在实际应用中,真实的测量数据有可能不完全符合泊松模型,但复合泊松模型[37]可能更加精确。尽管如此,泊松模型在CT领域已经被很好地接受了[38]。
3 优化方法
3.1 GDSIR和ADSIR
由2.2小节可知,式(12)中正则化项表示对于待建图像的先验信息。不同的先验信息对应不同的重建算法。例如,相邻像素平滑变化的假设表示正则化相邻像素的平方差,分段恒定的先验信息支持TV正则化。正则化更加普遍的形式建立在广义高斯马尔可夫场(q-GGMRE)中,它有两个可调节参数,而平方正则化函数和TV正则化函数都是q-GGGMRF
全文共28486字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[144343],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。