医学图像分析中多实例学习的特征表示深度学习外文翻译资料

 2022-12-18 15:52:02

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


医学图像分析中多实例学习的特征表示深度学习

Yan Xu1,2, Tao Mo2,3, Qiwei Feng2,4, Peilin Zhong2,4, Maode Lai5, Eric I-Chao Chang2lowast;

1State Key Laboratory of Software Development Environment,

Key Laboratory of Biomechanics and Mechanobiology of Ministry of Education, Beihang University 2Microsoft Research, Beijing, China

3Department of Computer Science and Technology, Tsinghua University, Beijing, China 4Institute for Interdisciplinary Information Sciences, Tsinghua University, Beijing, China 5Department of Pathology, School of Medicine, Zhejiang University, China

{eric.chang,v-tamo,v-qifen,v-pezhon}@microsoft.com,xuyan04@gmail.com, lmd@zju.edu.cn

摘要

本文以医学图像为研究对象,研究了以最少的人工注释和良好的特征表示来完成高层次任务的有效性。在医学图像分析中,像细胞这样的物体具有明显的临床特征。以前开发的功能,如SIFT和HARR不能全面地表示这些对象。因此,特征表征尤为重要。本文通过深入学习(DNN)来研究特征表示的自动提取。此外,对象的详细注释通常是一项模糊且具有挑战性的任务。我们在课堂培训中使用多实例学习(MIL)框架,具有深入学习功能。从我们的工作中可以得出几个有趣的结论:(1)自动特征学习优于手动特征;(2)无监督方法可以获得接近完全监督方法(93.56%)与(94.52%)的性能;(3)粗标签的MIL性能(96.30%)超过细标签的监督性能(95.40%)在有监督的深度学习功能中。索引项-深度学习、特征学习、监督、无监督、多实例学习。

1.介绍

在医学图像分析中,为高层次的任务(如分类和分割)设计一组特定的特征[1,2]是很常见的[3]。同时,医学图像的详细注释往往是一个模棱两可、富有挑战性的任务。本文论述了用最少的人工注释和良好的特征表示来完成高级别任务的有效性和效率[4,5,6]。

关于特征表征有着丰富的文献。特征提取的主要方法有人工设计的特征描述符[7,8]、完全监督的特征学习[9]和无监督的特征学习[10]。人工设计的特征描述符[7,11]包括梯度操作符和过滤库,无法捕捉医学图像中常见的复杂变化。完全监督的特征学习[9]需要大量精确注释的数据。获取这些带注释的数据是耗时的、劳动密集的,而且不明确。无监督特征学习[12,13,14,15]基于未标记的数据。它可以从实际数据的统计中学习内在的和微妙的特征。本文在医学图像领域对这些方法进行了研究。我们使用SIFT[7]、LBP[8]和Ltimes;Atimes;B颜色直方图作为人工特征。我们从深度学习神经网络的最后一个隐藏层入手,探讨了作为完全监督特征的特征。我们采用K均值聚类算法导出的质心单层网络作为无监督特征[16]。实验结果表明,全监督和无监督特征学习都优于人工特征学习。此外,我们还比较了完全监控特性中最后一个隐藏层的不同节点数量的影响。在全监督特征学习中,高维特征优于低维特征。

在分类等高级任务中,弱监督方法结合了完全监督和无监督的优点[3,17]。其目标是自动从粗标签中提取未经过滤的信息。多实例学习是弱监督方法的一种特殊形式。由许多实例组成的一个包。给定一系列的包标签,MIL使用包标签(粗标签)来预测实例标签(细标签)。本文研究了基于组织病理学图像的结肠癌分类。组织病理学图像被认为是一个包。一个图像被分割成多个补丁作为实例。如果包中至少含有一个阳性实例(癌组织),则包被标记为阳性。如果一个包包含所有负实例,则该包被标记为负。

本文的组织结构如下。在第2节中,我们描述了特征学习的相关工作和MIL框架。在第3节中,我们提出了研究特征学习的有效性和无效性以及培训不足的类文件的算法。在第4节中,我们报告了不同方法的实验结果。然后我们的结论将在第5节中给出。

2.相关工作

我们将相关工作大致分为三个部分:(1)医学图像领域的高级任务,(2)特征学习和分类中的深度学习,以及(3)多实例学习。

图1算法的流程图,最少有人工注释和良好的特征表示。输入包括癌症图像和非癌症图像。所有图像用于生成补丁。在特征学习处理中,图像/补丁用于缩小接受文件的样本。特征学习通过三种方法实现,包括完全监督的深层学习、单层网络的无监督学习和人工特征。下一步是提取每个补丁的特性。在分类处理中,我们进行完全监督分类(SVM)和弱监督分类(MIL)。整体补丁级别分类(癌症与非癌症)可根据分类者的信心获得。红色代表癌斑,绿色代表非癌斑。

医学图像领域中的分类和分割等高层次任务是一个热门话题。由于图像的临床性质,以往的许多工作都集中在特征设计上。主要方法包括人工特征设计、监督特征学习和无监督特征学习。Boucheron[18]和Chang[19]专注于手动功能设计,Whilele[20]专注于无监督功能学习。Boucheron等人[18]利用细胞核分割结果作为特征来提高乳腺癌组织病理学图像分类的准确性。图像级分类中的特征尺寸为1035。Chang等人[19]在空间金字塔匹配的不同位置和尺度上提出了核水平的形态学特征,以对肿瘤组织病理学图像进行分类。Le等人[20]提出了一种具有非线性响应的双层网络,用于自动学习组织病理学肿瘤图像中的特征。在我们的工作中,我们比较了结肠组织病理学数据集的三种主要方法。特征学习方法优于手动特征操作。

深度学习既可用于分类学习,也可用于计算机视觉和语音等各种领域的功能学习。在声学情感识别[21]和图像网[22]中,使用深度学习作为分类工具。深度学习可用于特征学习,包括有监督的[9]和无监督的[20]。在我们的工作中,我们试图深入学习特征表示与MIL分类结肠组织病理学图像。

多实例学习是一种弱监督的学习框架。在培训中,MIL框架使用了最少的手动注释。我们之前提出了通过使用包级别标记数据预测实例级别数据对结肠组织病理学图像进行分类的框架[3,17]。但是,我们使用手动功能和mil来完成这项任务。本文将特征表示的深入学习与MIL框架相结合,对结肠组织病理图像进行分类。该算法将训练与最小人工注释和良好的特征表示相结合。此外,我们的方法是通用的,可以应用于除结肠组织病理学图像以外的MIL任务。

3.算法

在本节中,我们将介绍我们的实验中使用的算法。我们的任务是预测一个图像是阳性(癌症)还是阴性(非癌症),如果是阳性的话,还可以勾勒出癌症区域。我们将问题表述为补丁级分类。如果图像中的任何补丁被识别为阳性,则该图像将被视为癌症图像。否则,所有补丁都属于负片,图像被视为非癌症图像。我们的算法是一个流水线过程,如下:(1)从正(癌)和负(非癌)图像中生成斑块;(2)使用图像/斑块生成良好的特征表示;(3)通过学习特征模型或人工特征操作符提取特征;(4)通过使用经过充分监督或弱监督培训的类别,将补丁分为正片或负片以及(5)以获得补丁级别分类结果。图1是算法图。我们将详细介绍管道流程中的一些关键步骤。

3.1全监督特征学习框架

在本节中,我们描述了完全有监督的特征深度学习算法。我们提出了一个基于深度学习的系统,在编码器和解码器中有一组线性滤波器。深度学习网络是一个从低级特征中提取高级特征的过程。低层的节点表示低层的功能,而高层的节点表示高层的功能。与底层特征相比,最后一个隐藏层节点可以表示本质特征。在应用于语音识别的[9]中也发现了类似的工作。我们使用了深度学习的最后一个隐藏层,即全面的高级功能学习。不同的网络可以实现不同的性能。与[23]、[24]相似,卷积和最大化/均值化池是图像分析中常见的网络层。

在本文中,我们尝试使用两个网络来评估最后一个隐藏层特征的效率和有效性。在网络中,一个卷积和池交替使用,没有完全连接层(DNN2-F);在网络二中,最后一层是完全连接层,在卷积和池(DNN1-F)之后。卷积和池生成的节点是巨大的。在我们的实验中,维数是160000。主成分分析(PCA)[25]用于减小DNN特征的尺寸。

3.2无监督特征学习框架

无监督特征学习是一种不需要昂贵的人工注释的方法。它可以从实际数据的统计数据中学习内在和细微的特征[16]。考虑到使用未标记数据的好处,我们探讨了无监督特征学习。在实验中,我们使用K-均值中心的单层网络作为无监督特征学习。分别描述了特征学习和特征提取。

特征学习:感知域(rf)被定义为图像(包)中htimes;w补丁(实例)的dtimes;d子图像。在我们的工作中,步幅被设置为1,因此一个补丁完全具有(h-d 1)times;(w-d 1)感知域(rfs)。对于三通道(RGB)图像,可以将射频描述为中的矢量。算法的第一步是成数据集的“质心”。质心也是中的一个向量,质心是所有图像的所有斑块中“最常见的rfs”。我们从图像集中随机抽取n个rfs,形成一组向量p,然后运行k-均值算法生成k形心C1,hellip;,Ck。k均值算法包含t次迭代。在每次迭代中,我们确定以欧几里得距离测量的最接近的质心,以p表示的每个rf,并将rf分配给质心。然后,对于每个质心Ci,我们取当前迭代中分配给这个质心的所有rfs,并将质心修改为一个新的,这是所有这 rfs的平均值。在对T轮进行这样的迭代之后,质心集收敛到描述P最常见的rfs。

特征提取:质心用于从面片中提取特征。假设一个补丁的尺寸为htimes;w,那么它有(hminus;d 1)times;(wminus;d 1)rfs。对于一个rf pisin;,我们可以将其映射到向量f(p),其中

fi(p) = max{0,mu;minus;zi},1 le; i le; k

(1)

zi = ||pminus;Ci||2, mu; =(i zi)/k..Ci是t迭代后的最终质心。因此,在Rk中有(h-d 1)times;(w-d 1)矢量,然后我们进行了汇集过程:将网格划分为Ltimes;L等分(在我们的工作中,L=2),并将每个部分的矢量相加,得到中的Ltimes;L矢量,然后将其集中到Ltimes;Ltimes;K维矢量中。这是输入补丁的特征向量。

注意,在k均值算法和特征提取过程中,我们不使用任何标签信息。

3.3多实例学习

详细的人工注释耗时且本质上不明确。另一种方法是使用全局注释学习局部概念,这是多实例学习(MIL)的主要思想。MIL是一个弱监督的学习框架。训练集包含由未标记实例组成的标记包,任务是预测未标记包和实例的标签。本文中,一个包是一个大尺寸的图像,一个实例是一个可分辨的补丁。如果且仅当包中至少有一个阳性实例,即图像的某些部分,但可能不是整个图像都是癌组织时,包才会被标记为阳性。因此,我们可以建立一个二进制的mil模型,优化行李分类的损失函数,而包分类是实例分类的最大值。具体来说,XI= {XI1,XI2,hellip;,XIM}是训练集中的第i个包,M是第i个包中的实例数,{XI1,XI2,hellip;,XIM}是这个包的实例。yiisin;minus;1, 1为标签,-1为阴性包, 1为阳性包。h(x)isin;x→[0,1]和h(x)isin;x→[0,1]是包级分类和实例级分类,给出了包和实例的正概率。对于包Xi,H(XI)=SULTMax(H(XI1),H(XI2),hellip;,H(XIM))。在我们的工作中,SoftMax函数是广义均值(gm)。损失函数为:

(2)

图2完全监控数据集中的几个例子。最上面一行:阳性(癌症);最下面一行:阴性(非癌症)。

其中1(·)是一个指标函数。使用梯度下降算法,我们可以使用权重迭代训练弱类h(x):

(3)

并通过larr;更新,其中alpha;是通过线性搜索获得的系数,以最小化损失函数。在对损失函数进行了有效的迭代后,我们生成了一个有效的类。这种算法叫做MIL-Boost.。

4.实验

4.1数据集集合

高分辨率组织病理学图像被用来构建我们的数据集。所有图像均取自132例患者的组织病理学图像。由于一台机器的计算能力,每个图像被设置为10000x1000像素。这是一个MIL里提到的包。我们对200x200像素的补丁进行了采样,而重叠步长为100像素,因此我们获得了9801个补丁,每个补丁都是一个实例。具体数据集如下(见表1):

完全监控的数据集:首先我们选择了30张癌症图像,并手动分割细胞。在标记的癌区内完全封闭的9000个斑块被用作阳性实例。从30张非癌症图像中,我们随机抽取9000个补丁作为阴性实例。训练集和测试集,均包含4500个正实例和4500个负实例,并从上述数据中选择。训练集不仅用于训练SVM和DNN等完全监督学习算法,而且是弱监督学习的评价数据集。图2显示了补丁的几个示例。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[20125],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。