硕士论文网/国内首批论文服务机构

当前位置:硕士论文网首页 > 软件工程 > 软件工程视角下基于深度学习的医学图像分割方法研究

软件工程视角下基于深度学习的医学图像分割方法研究

时间:2020-08-25 10:12 | 栏目:软件工程 | 浏览:

硕士论文网第2020-08-25期,本期硕士论文写作指导老师为大家分享一篇软件工程文章《软件工程视角下基于深度学习的医学图像分割方法研究》,供大家在写论文时进行参考。
  本章首先阐述了现基于 U-Net 模型的医学图像分割方法的缺点,包括:(1)  所使用的卷积不具有学习几何形变的能力;(2)  所采取的上采样方法存在一定的缺陷;(3)  对于医学图像中类不平衡和简单样本过多造成的模型偏移问题,所采用的损失函数不能有效地解决。针对这些问题,本章提出了一种改进的 U-Net,该网络由可变形编码器和 RUC 解码器组成,并将 Focal Loss 应用到医学图像分割中。该模型的参数较于经典 U-Net 大大减少了,并且具有良好的学习几何形变的能力和更加有效的上采样结构。本方法在 Drosophila EM 数据集和 Warwick-QU 数据集进行实验,取得了接近最高水准的分割结果。 

第 1 章  绪论 

1.1  研究背景及意义 
  医学图像包含了丰富的解剖结构和病理信息,在医学研究与诊断中发挥着重要作用。根据成像技术的不同,医学图像包括了计算机断层扫描图像(CT)、超声图像(ultrasound)、磁共振图像(MRI)、内窥镜图像和显微镜图像等[1]。CT 图像、MRI 图像和超声图像是通过非侵入方式获得生物体内部器官和组织的影像,具有透视能力。内窥镜图像和显微镜图像则是利用光学信号对生物组织或器官成像,颜色和纹理等信息更加丰富。根据需求不同选择不同类别的医学图像,并通过医学图像处理技术可以更客观地了解生物体的生理状态和病理变化。常用的医学图像处理技术包括医学图像增强、医学图像配准、医学图像分割、医学图像可视化等。其中,医学图像分割的目的是区分具有特定意义的不同区域,任意两个区域之间没有交叉,且每个区域都满足属性的一致性,其对三维可视化、病理分析、临床诊断和医疗干预等领域都具有十分重要的意义,是医学图像处理与分析的热点研究领域之一。 医学图像分割方法可分为人工分割、半自动分割和自动分割三种[2]。人工分割方法十分耗时,并且依赖于临床专家的知识经验等主观因素,可重复性较差,不能完全满足临床上的实时需要。半自动分割方法采取人机交互,在一定程度上提高了分割速度,但仍然依赖于观察者,限制了其在临床实践中的应用。自动分割方法完全借助计算机提取出感兴趣区域边缘,这种方法完全避免了观察者主观因素的影响,提高了处理数据的速度,可重复性好。然而,由于在医学图像中,目标个体结构的复杂变化以及各种医学成像方式和技术造成的低对比度、噪音等影响,使医学图像的可变性很高。因此,高效的医学图像分割方法成为目前图像处理的研究热点之一[3]。 随着科技的发展,深度学习技术被广泛地应用于各个领域,包括图像识别、目标检测、图像分割和自然语言处理等。较于传统方法,基于深度学习的算法具有强大的学习能力,在运行速度和准确率上都有很大的优势。因此,基于深度学习的医学图像分割方法具有非常重要的研究意义。 
1.2  国内外研究现状 
  医学图像具有噪声较多、对比度低、分割目标形状变化复杂等特性,造成了自动分割难度增大。为此,国内外研究学者提出并改进了一系列医学图像分割方法。下面将对医学图像分割的国内外研究现状进行简要介绍和优缺点分析。 传统医学图像分割算法主要依赖灰度、梯度、纹理以及统计结构等浅层特征来进行目标提取。根据图像特点和分割原理,常用的传统医学图像分割方法主要包括:阈值法[4,5]、分水岭法[6,7]、图谱法[8,9]、活动轮廓模型法[10,11]等。
①阈值法 
  阈值法是一种经典有效、快速的图像分割方法。它的基本原理是利用整张灰度图像的直方图选取一个或多个阈值,再将所有像素的灰度值与所选取的阈值进行比较归类,进而将图像划分为不同的区域,这种阈值叫做全局阈值。在实际应用中,图像的分布往往不均,根据整张图像来确定阈值得到的分割结果往往很差。因此,可以在不同的区域选择不同的阈值,这种阈值叫做局部阈值。除了阈值个数外,阈值大小的确定也是成功分割的至关因素。阈值过大会造成分割目标无法完整地提取出来;反之,则会将一些背景像素归类为分割目标,造成提取的区域过大。为了选择合适的阈值,研究者提出了大量相关算法,其中以 Otsu 法[12]最为经典。阈值法具有速度快的优点,但是对噪声很敏感,且分割结果往往很粗糙,常常作为分割的初步结果。 
②分水岭法 
  分水岭分割方法是基于数学形态学的图像分割方法。顾名思义,其基本思想就是将图像看作是地测学上的拓扑地貌,图像中每个像素的灰度值大小代表该点在地貌中的海拔高度,每一个局部极小值及其影响区域称为积水盆地。在每个积水盆地的中心点刺穿一个小孔,然后将整个地貌浸入水中,随着水从底部渗入,积水盆地的面积不断地扩大,积水盆地汇合的地方形成了大坝,这些大坝就是分水岭,也是分割目标的轮廓线[13]。分水岭法具有分割效率高,可产生完整分割轮廓的优点。但对于分布不均的图像,局部极小值很多,任何一个局部极小值都会产生一个形状边界,因此容易出现过分割的情况。分水岭法也通常作为分割的后处理方法将两个相连的区域分开,改善分割结果。 
③图谱法 
  图谱图像指的是包含一张原始图像和一张对应的分割标准图,基于图谱的图像分割方法首先将图谱图像中的原始图像与待分割的图像进行配准,得到两者之间的变换参数,然后根据所得到的参数对图谱图像的分割标准图进行变换,最后得到的即为待分割图像的分割结果[14]。基于图谱的方法,有一定的分割效果,但是分割精度在很大程度上依赖于图谱之间的相似度。 

第2章 预备知识 

  随着深度学习技术的发展,卷积神经网络被广泛地应用到医学图像分割领域。卷积神经网络拥有强大的自动提取特征能力,这使得基于深度学习的医学图像分割方法相较于传统方法在分割准确率和效率上有更好的表现。本章节主要介绍关于深度学习的相关知识,以及常用的基于卷积神经网络的医学图像分割方法。 
2.1  数据增强 
  深度学习往往需要大量的数据进行训练,以获得具有较好泛化能力的模型。但是医学图像获取较难,并且需要占用医生大量的时间进行标注以获得分割标签图,这两个原因导致很难获得大量的训练数据[16]。因此,研究者常常通过数据增强技术来生成数据集额外的图像,以获得更多的训练图像,这是深度学习中至关重要的一步。数据增强是通过一些几何变换对原始图像进行操作,获得新的图像,常应用到图像分类任务中。这些新的图像与原始图像是独立同分布的,并且也是现实中可能存在的。其目的是使网络学习到更多的不变性特征,增强对几何变换的鲁棒性,提高对数据集的利用率。对于医学图像分割任务,数据增强方法应兼顾以下两点:(1)  根据分割对象,选择合适的数据增强方法以保留形状和边缘等重要的诊断特征;(2)  对分割标签图也要做相应的变换,与变换后的新图像对应。 常用的数据增强方法包括翻转、旋转、缩放、剪裁以及上述方法的组合。为了方便训练,扩增得到的新图像需要与原始图像的大小一致。 
  1. 翻转:对原始图像进行水平或垂直方向镜像翻转,以改变图像内容的位置,可以提高网络对位置变化的鲁棒性。 
  2.  旋转:人为设定或随机生成旋转角度和方向,对原始图像进行旋转,可以提高模型的旋转不变性。当旋转角度不是 90°的倍数时,将导致图像的每个角落会被填充。为了缓解这个情况,通常对旋转后的图像进行剪裁,并在保持长宽比的同时尽可能地保留更多图像内容。需要注意的是,旋转角度不宜过大,否则会造成剪裁后的图像过小,图像内容减少过多。 
  3.  缩放:以一定的比例分别对图像的长和宽进行缩小或放大,进而改变图像的长宽比,所选比例由人为设定或在一定范围内随机选取。对缩放后的图像进行随机剪裁,再插值到与原始图像一样的大小。值得注意的是,长宽的缩放比例不宜相差过大,否则会极大改变图像中物体的比例,造成失真。该方法可以提高网络对尺度变换的鲁棒性。 
  4.  剪裁:对原始图像进行随机剪裁,与缩放不同的是,剪裁并不改变图片的长宽比。 
常用数据增强效果图
  以电子显微镜下的细胞图像为例,图 2.1 展示了对原始图像和标签进行翻转、旋转、缩放和剪裁的效果图,标签图中白色表示细胞,黑色表示细胞膜。从图中可以看出,数据增强可以大大提高图像的多样性,扩大数据集。在数据增强的过程中往往会用到双线性插值,标签图会产生小数,这与标签必须是整数相违背,因此需要对新的标签图进行二值化操作。 
2.2  卷积神经网络 
  Hubel 等人[33]在二十世纪六十年代通过对猫脑的研究,在其视觉皮层发现了一些特别的细胞。这些细胞具有复杂的结构,对视觉的局部区域具有很高的敏感性,被称为“感受野”。感受野因其局部敏感性,可以很好地提取图像的局部空间特征。同时,在该文献中 Hubel 等人认为视觉皮层的神经网络具有层级结构,在该结构中,较高层的细胞具有较大的感受野,可以有选择地提取高级特征,且对响应的位置不敏感,对输入具有很好的位置不变性。Fukushima 根据 Hubel 等人提出的层级模型,设计了具有层级结构的神经认知机[34]。该神经认知机由简单层和复杂层交替构成,简单层可以提取输入的局部特征,复杂层对响应的具体位置不敏感,可以提取更加复杂的特征。因此,它对位置和形状的变化具有很好的鲁棒性,能够准确地识别图像。上世纪八十年代末,LeCun 在 Fukushima 的工作基础上设计一种具有多层结构的 CNN 模型,取名为 Le Net-5[35]。如图 2.3 所示,其可被认为是经典的 CNN 结构,在一些图像分类任务上取得了较好的结果。然而在大规模且复杂的图像分类任务上表现不佳,并且当增加神经网络的层数时,会遇到无法达到最优等问题,造成深层神经网络的研究停滞[36]。 2006 年,Hinton 等人[37]提出了两个主要观点:(1)  深层神经网络拥有强大的特征提取能力;(2)  采用逐层预训练方法可以有效地解决深层神经网络难以训练的问题。从此,引发了对深度学习研究的热潮。随着计算机运算能力的提高和大数据的发展,Alex 等人[38]在 2012 年设计了一种深度卷积神经网络——AlexNet,并在当年的 ImageNet 图像分类挑战赛[39]上取得了最佳效果。该挑战赛的数据集拥有上百万张图片,包含了 1000 个类别,在图像识别领域具有十分重要的意义。AlexNet模型有效地利用了多 GPU 提高运行速度,并且采用了 Dropout[40]技术进行正则化,极大地提高了识别准确率。AlexNet 取得的巨大成功又一次引发了深度学习的热潮,在计算机视觉领域,也越来越多的方法采用卷积神经网络。 
LeNet-5 网络结构示意图
  卷积神经网络包含了卷积层(Convolutional Layer)、激活函数、池化层(Pooling Layer)和全连接层(Full  Connection  Layer)。如图 2.3 所示,卷积层和池化层交替设置进行特征提取,在网络最后采用全连接层整合提取的特征并输出类别概率。在基于深度卷积神经网络的图像分割方法中,采用的就是这种分类网络。在基于全卷积神经网 络的图像分割方法中,全连接层被舍弃,通常采用反卷积层(Deconvolutional Layer)等上采样方法进行分辨率恢复,直接输出分割概率图。 

第 3 章  基于全卷积 DenseNet 的医学图像分割方法

3.1  引言 
3.2 U-Net 分割网络
3.3 DenseNet 分类网络
3.4  基于全卷积 DenseNet 的医学图像分割方法描述 
3.5 实验与结果分析
3.6 本章小结

第 4 章  基于改进 U-Net 网络结构的医学图像分割方法

4.1 引言
4.2 基于改进 U-Net 网络结构的医学图像分割方法描述
4.3 实验与结果分析 
4.4 本章小结 

第 5 章  总结与展望 

5.1  总结 
  医学图像分割对三维定位、三维可视化、手术规划和计算机辅助诊断等都具有十分重要的意义,是图像处理与分析的热点研究领域之一。随着深度学习技术的快速发展,基于深度学习的医学图像分割方法较于传统方法在特征提取、分割效率和准确度上具有明显优势。本文重点研究的全卷积神经网络是深度学习中普遍应用于医学图像分割的模型,具有重大的研究意义。 本文首先从医学图像分割的研究背景出发,说明了本课题的研究意义,简要分析了国内外研究现状,包括传统医学图像分割方法和基于深度学习的医学图像分割方法。其中重点对基于全卷积神经网络的医学图像分割算法及其改进算法的研究现状进行了介绍。然后为了确保论文的严谨性和方便读者理解后续研究工作,介绍了相关预备知识,包括数据增强方法、卷积神经网络基本结构和基于深度学习的医学图像分割方法的提出、基本原理以及存在的优缺点。最后针对现基于全卷积神经网络的图像分割方法的问题,从加深网络和提高卷积核特征提取能力两方面提出了相应的改进方法,并通过实验结果和数据验证了算法的有效性和先进性。本文的主要工作内容有: 
  1.  提出了一种基于全卷积 DenseNet 的医学图像分割方法。该方法受 U-Net 和DenseNet 的启发,将 DenseNet 从自然图像迁移到医学图像数据集,作为特征提取部分;并且采用反卷积和类似 U-Net 的全卷积神经网络结构,实现端到端的图像分割。同时引入并改进 Dice 相似性损失函数以解决前列腺 MRI 中背景所占比例远远大于前列腺区域和一些像素难以准确分割等问题。该方法在 PROMISE12 数据集上进行实验,Dice 相似性系数达到 93.25%,Hausdorff 距离小于 1.2mm,相较于目前的主要方法,分割效果更好,所耗时间更短。 
  2.  基于 U-Net 网络及其改进网络所使用的常规卷积因其固定的几何结构限制了对几何形变的学习能力,上采样方法也存在一定缺陷,针对这些问题提出了一种改进的 U-Net 网络结构。该分割网络采用改进的可变形卷积代替编码器中的常规卷积,并且提出了一种新的上采样方法。该上采样方法是可学习的,并且不需要像反卷积那样填充零。针对生物医学图像中样本分布不均和简单样本过多导致的模型训练困难问题,将 Focal Loss 应用到生物医学图像分割任务中。该分割方法不仅大大降低了网络的参数数量,并且在果蝇细胞数据集和 Warwick-QU 腺体分割数据集上取得了显著的效果,较于现有主要方法具有更强的泛化能力,显著提高了分割精度。 
5.2  未来工作展望 
  本文虽然对基于全卷积神经网络的医学图像分割算法进行研究,提出了两种改进方法,并获得了较好的分割效果。但还有不足,本文内容还有进一步研究与完善的空间,后续的研究工作方向如下: 
  1.  本文第三章中提出的“基于全卷积 DenseNet 的医学图像分割新算法”,网络结构复杂,参数数量极多,容易出现过拟合。虽然采用了数据增强和 L2 正则化等方法来防止过拟合,但并没有完全解决。为此,更多的防止过拟合方法是进一步的研究方向,包括更多的数据增强方法或者利用生成对抗网络(GAN)来生成图片,添加 DropOut 等。 
  2.  本文第四章中提出的“基于改进 U-Net 网络结构的医学图像分割方法”,采用了可变形卷积,提高了网络特征提取的能力,并极大地减少了网络的参数数量。但是由于其对输入特征图扩大了九倍,训练时,在反向传播结束前需要保留所有特征图,因此会占用极大的 GPU 资源,导致可变形卷积的数目不能过多,否则会出现内存溢出的情况。为此,可以进一步研究可变形卷积的优化方法,降低GPU 的占用率。 
  3.  本文所提出的两种改进网络采用的都是 2D 卷积,而很多医学图像是许多切片构成的 3D 图像,2D 卷积很难学习到切片间的空间信息,这些空间信息对目
标的识别有时也是非常重要的。在以后的研究工作中,可以考虑利用 3D 卷积来提取切片间的信息,提高分割结果的准确率。


以上论文内容是由硕士论文网为您提供的关于《软件工程视角下基于深度学习的医学图像分割方法研究》的内容,如需查看更多硕士毕业论文范文,查找硕士论文、博士论文、研究生论文参考资料,欢迎访问硕士论文网软件工程栏目。