硕士论文网第2020-11-25期,本期硕士论文写作指导老师为大家分享一篇
医学论文文章《基于机器学习的医学影像研究与辅助诊断平台》,供大家在写论文时进行参考。
本篇论文是一篇医学硕士论文范文,深度学习算法是第e次人:d智能浪潮中最具有力量的产物,可以说深度学习配含高速度硬件的运行机制己经在各个领域中都开始崭露头角。智能医疗领域同
样离不开深度学习算法,包括图像的分类和分割,传统的常规算法不能有效解决的问题通过深度学习都可以得到较好地解决。
第一章 绪论
人工智能技术自上世纪五六十年代被正式提出以来,经历过高峰也经历过低谷。但是,人们对于人工智能的探索从未停止,无论是第一台神经网络计算机的诞生还是图灵测试的提出,或是达特茅斯会议的成功举办还是计算机的广泛应用,都对如今的人工智能产生了莫大的影响。经历了两次高峰和低谷后,目前的人工智能以机器学习技术和深度学习技术为主要构成内容,同时也是第三次人工智能高峰中众多研宄者和工程师不断探索的方向。医学作为传统的应用学科具有很高的研宄和应用价值,而人工智能技术和传统医学相结合的智能医疗领域将具有极高的潜在研宄价值。本章将主要介绍人工智能领域以及智能医疗领域中具备较高价值的相关研宄方向的发展概况。
1.1 影像组学的研究进展
十九世纪末X射线的发现标志着医学影像学的起源。多维度、高广度的医学影像成像技术的发展除了能够帮助影像科医生更清晰地了解病情外,也积累了许多宝贵的影像数据。但是,传统的成像方法只能半定量地提取肿瘤的形态特征,不能预测肿瘤的异质性。因此,更全面、更系统的图像分析技术的研发迫在眉睫。随着第三次人工智能技术的兴起,医学影像和人工智能相结合的智能医疗领域开始繁荣发展。2012年,荷兰研宄学者Lambin第一次提出了“影像组学”的概念'影像组学是一种旨在通过对医学影像进行一阶和高阶图像特征提取和分析以建立可能提高诊断、预后和预测准确性模型的研宄领域。随着影像组学的不断发展,更多的科研人员逐渐加入该领域中,完善解决了许多问题。目前在组学领域中,影像组学已与基因组学等相结合,共同建立预测模型。通过研宄者近年来在影像组学领域中的不断探索,已经形成较为成熟的影像组学研宄流程。主要包括以下五个部分:1.感兴趣区域(Region of Interest,R0I)的提取;2.影像组学特征的提取;3.影像组学特征的降维;4.机器学习建模;5.模型评价及预测。R0I的提取主要包括手工勾画提取、半自动提取和全自动提取三种方式。其中全自动提取和半自动提取亦即全自动分割和半自动分割,基于深度学习的医学影像R0I全自动分割在肝脏、视网膜、胰腺、心脏、肺结节等部位上都有不错的表现7u1,半自动分割的准确度也在逐步提高。目前,分割技术对于较大的或边界区分度较为明显的R0I有不错的效果。大多数在影像组学领域中的研宄者都采用手工勾画R0I的方式由于影像组学是针对R0I进行高阶特征提取,因此R0I提取的准确度至关重要。
1.2 深度学习的研究进展
随着计算机硬件算力的不断提升,人工智能在近年来终于迎来了第三次高峰。深度学习技术在人工智能领域中占有重要的地位,高精度、高鲁棒性是深度学习模型的重要特点。第一代神经网络起源于1943年的MCP人工神经元模型,1958年Rosenblatt提出的感知机算法可以使用MCP模型对输入数据进行二分类。1986年,Hinton提出了反向传播算法,其适用于多层感知器并采用Sigmoid函数,对非线性分类问题进行优化。由于深度学习有梯度消失的问题,因此2006年,Hinton提出了针对此问题的解决方案:权值的初始化采用无监督预训练,同时用有监督对权值进行微调。2012年至今,越来越多的深度学习网络被提出和应用在图像识别、图像分类、图像分割等领域,且均取得了突破性的成果。在图像领域中,深度学习一开始的研宄便侧重在分类任务上。随着神经元模型的发展,卷积神经网络的提出逐渐打破了图像分类任务的瓶颈。1998年,YannLeCur^1等人提出了LeNet,主要用来解决手写数字识别的视觉任务。同时它也确定了卷积神经网络的基本架构,即除了输入层外共有7层,由卷积层、池化层、
全链接层构成。2012年,Hinton和他的学生Alex Krizhevsky341共同设计了卷积神经网络:AlexNet,此网络在同年的ImageNet竞赛中以超过第二名10.9个百分点准确率的绝对优势拿下冠军。2013年,ZFNet在ImageNet分类任务中取得冠军。相比于AlexNet,ZFNet并没有对网络结构做非常大的改变,只是在局部进行调参,但是性能较Alex提升了很多。2014年,VGG-Nets351由牛津大学提出,相比于AlexNet,其加深了卷积层数并在同年的ImageNet竞赛定位任务中取得冠军。2014年GoogLeNet被提出,并在同年的ImageNet分类比赛上打败了VGG-Nets夺得第一。其在加深网络的同时也在网络结构上做了创新。它引入Inception结构代替了单纯的卷积和激活函数的传统操作方式,并进一步把卷积神经网络的研宄推上新的高度'2015年何恺明提出的ResNet进一步开拓了卷积神经网络的新思路,它通过使用多个有参层来学习输入输出之间的残差,这种学习方式要比直接学习输入、输出间映射要容易得多,也有效得多。2017年DenseNet被提出,其借鉴了ResNet和Inception的部分结构,采用密集连接的卷积神经网络,能有效解决梯度消失的问题,加强了特征的重复利用,极大减少了网络参数量。随着卷积神经网络在分类任务中的不断发展,越来越多的研宄者开始以这些网络作为基础架构,通过简单调参和调整网络模型实现在医学影像中的分类任务。迀移学习是近年来在医学影像中较常见的模型构建方式,其通过找到两个任务目标的共性特点,以预训练的方式节约训练数据的数量成本、时间成本,用较少数据便可得到较高精度的模型。由于医学影像数据的珍贵性和数量少等特点,使得迀移学习往往成为较好的建模备选方案。
第二章 影像组学基本理论
从2012年影像组学的概念提出至今,随着越来越多的研宄者参与进来,影像组学的基本流程已经日渐成熟。虽然如此,统计学和机器学习领域的相关算法和研宄依然值得被参考和引入。高精度、高维度、高速度是影像组学发展的目标,因此每一个流程上的细节都需要不断更新和完善。本章将对影像组学的基本理论进行概述。
2.1 影像组学基本流程
标准的影像组学基本流程主要包括以下五个部分:1.感兴趣区域的提取,2.影像组学特征的提取,3.影像组学特征的降维,4.机器学习建模,5.模型评价及预测。其中,在感兴趣区域的提取前,需要对原始数据进行预处理,包括数据隐私信息的清理、数据标准化、数据格式转换等操作。同时,随着多信息融合方式的提出,临床信息和影像组学相结合共同研宄的方式也日渐普遍。因此,临床信息的筛选及其特征融合也逐渐成为关键的环节。在下面的内容将针对每一个环节详细讨论相关算法和实现方式。
2.2 图像处理
图像预处理是进行影像组学研宄前十分关键的步骤,其按照处理需求可以分为两类:一、必要的图像预处理流程;二、根据研宄目的可选择的图像预处理方式。其中,必要的图像预处理流程包括:l.DICOM(Digital Imaging andCommunications in Medicine)格式数据的隐私清洗;2.图像的重采样。可选择的图像预处理方式包括:1.根据研宄目的不同,将原始图像按照一定标准分类(如不同扫描设备),2.不同图像格式的转换,以便可以进行感兴趣区域的勾画或影像组学特征的提取。DIC0M格式已经成为医学图像中使用较多的文件格式,基于DIC0M3.0标准的医学图像中,每一张图像都携带大量信息,主要可分为四类:Patient、Study、Series和Image。每一类信息都可以用DICOM TAG标识,DICOM TAG由两个十六进制数组成,通过检索不同的DICOM TAG,可以获得对应类别的具体信息。其中Patient类别主要包括患者的临床信息,如姓名、出生日期等。Study类别主要包括检查信息,如检查ID、检查日期等。Series类别主要包括图像的序列信息,如图像方位、层厚等。Image类别主要包括图像的具体信息,如窗宽窗位、像素间距等。由于在研宄中需要保护患者的隐私和个人信息,因此数据在入组前需要通过读取DICOM序列头文件,对患者姓名等隐私信息进行清洗。然而有些研宄中需要进行多特征融合实验,因此要保留患者的年龄、性别等临床信息。一般来说,在获准患者知情同意后,只要清洗掉关键的隐私信息即可。图像重采样技术是图像预处理中较为关键的环节。由于不同体型的病人在扫描后都会得到相同的数字成像分辨率,因此相对于真实空间来说,单个图像像素所代表的信息不能代表同样大小的体素信息。每一张医学图像都对应两个坐标系,分别为图像坐标系和空间坐标系。为保证影像组学特征的标准化,我们需要将图像像素统一成标准体素,进而排除掉由于图像信息不对称所带来的特征差异,这个过程即是图像的重采样。通过图像重采样后即可保证数据的标准化和实验的可重复性。一般来说,常用的医学数据格式(如DICOM、Nifty等)均含有图像像素间距的参数,通过插值方式实现对参数的统一设定。重采样后图像大小的变换过程如公式(2.1)所示,其中spacing代表原始图像像素间距,new_spacing代表标准图像像素间距,shape代表原始图像大小,new_shape代表重采样后的图像大小。
第三章 深度学习基本理论
3.1 深度学习分类网络概述
3.2 深度学习分割网络概述
3.3 深度学习在医学影像中的图像预处理
3.4 本章小结
第四章 RIAS设计及相关实验研究
4.1 RIAS平台的框架内容
4.2 基于RIAS平台的结直肠癌肝转移影像组学实验的研究
4.3 基于RIAS平台的结直肠癌肝转移迀移学习实验的研究
4.4基于RIAS平台Unet网络的肝脏分割实验的研究
4.5本章小结
第五章 RIAS平台的实例化及嵌入式应用
5.1 RIAS平台的多版本设计
5.2 RIAS平台的临床自动化预测实例
5.3 RIAS平台同嵌入式设备通信
5.4 RIAS平台的软件加密
5.5 本章小结
第六章 总结与展望
人工智能技术作为第四次科技革命的重要组成部分已经逐渐融入我们的生活,如何利用人工智能创造更具有创新性、普适性的研宄成果和相关产品成为了越来越值得探讨的话题。医学作为自古以来的经典传统学科目前也迫切需要引入富有创新技术的新鲜血液来更好地辅助医疗研宄和实施临床诊断。人工智能和医学结合的新兴智能医疗领域逐渐被科研工作者所接纳和提倡,但是对于研宄更精准的智能医疗算法、开发更便捷的智能医疗软件还需要更多的探宄和讨论。本文主要针对机器学习算法在智能医疗领域中的应用进行论述,同时介绍了自主研发的RIAS医学影像研宄和辅助诊断平台在实际科学研宄和工程落地的相关应用。本文首先介绍了智能医疗领域中的两个研宄热点即影像组学和深度学习分类分割算法的相关内容,分别从两个研宄热点的背景概述、研宄进展和研宄现状进行了简单的讨论。接着进一步从理论层面分别对影像组学、深度学习分类网络、深度学习分割网络进行了详细地阐述。主要以影像组学中的五个关键流程作为讨论点,分别在图像处理、ROI勾画、影像组学特征提取、特征工程、模型建立和评价标准等方面从原理上进行详细地论述。再以深度学习中几个经典的分类网络为讨论主线,从卷积层、池化层、全连接层等关键技术着手进行分析,同时讨论了经典的深度学习分割网络FCN、Unet等,并根据网络结构即端到端的特性分析了网络在分割任务中的优势和不足。其次,本文主要介绍了RIAS平台的开发目的、开发功能和开发流程等内容,集成了上述理论层面的关键环节并用可视化操作界面实现快速建模等相关研宄工作。接着以结直肠癌肝转移的实际研宄课题为例,详细介绍了应用RIAS平台进行影像组学相关研宄的流程和结果。通过优化关键的五个步骤并结合多特征融合算法,最终得到了高精度、泛化性强的模型。同时,本文以同样的研宄课题为例,讨论了在RIAS平台中应用迀移学习实现图像的分类任务。通过对图像应用预处理、数据增广等操作,最终得到了较为精确的模型。最后以肝脏分割课题为例,讨论了在RIAS平台中应用Unet分割网络进行肝脏分割的课题研宄,最终得到了高精度分割网络模型。以上三个综合实验不仅证明了RIAS平台算法的可性,同时也验证了RIAS平台在智能医疗领域中具备较高的应用价值。最后,本文详细介绍了RIAS平台在工程上的应用和价值前景,重点介绍了可进行临床应用的实例化研宄和嵌入式设备的应用。通过引入固定化模型,RIAS平台可支持对特定医学任务的全自动执行,如脏器分割、图像分类、图像预测等。同时通过引入MQTT协议可以实现内网结果的嵌入式广播,真正做到局域互联。RIAS平台的设计初衷是为了解决医学研宄者能够便捷地使用医学数据进行智能医疗领域相关研宄进而得到高精度、高稳定性的模型的需求而提出的。除了在研宄领域中可以使用平台方便地得到结果外,对于已得到的高稳定性模型还可以提供进一步的临床实际应用的功能。目前RIAS着眼于智能医疗的研宄领域、可期待的临床应用领域以及未来的数据中心处理集成领域,致力于解决智能医疗的tx业痛点,在提升医生诊断效率、提尚优质換型准确率上逐渐突破和完善。虽然目前RIAS实现了一些算法的基本功能,但是在原理、工程优化上仍有不足和短板,这些问题也亟待解决。RIAS平台主要提供影像组学和深度学习领域的相关算法。影像组学中在图像的预处理、和数据基本预处理上没有太大的问题,但是在特征工程和模型构建中仍有较大的提升空间。深度学习中在常规的图像预处理、图像分类建模、图像分割建模没有较大的问题,但是在多模型融合、多模型构建以及niftynet网络的搭建上仍有提升的空间。以影像组学举例,虽然研宄者可以便捷地导入数据进行相关模型的构建,但是在特征工程的优化上仍然无法做到数据匹配,即自动地根据数据分布进行最优良的特征降维和筛选。目前最优化的特征降维算法都是采用广义搜索法,即通过对不同降维算法进行交叉组合,效能最好的结果即代表最优算法。但是如果只是进行广义的集成降维算法而不考虑数据分布的话将无法从根本解释数据和算法的匹配程度,也就无法进一步逼近数据的理论极限。因此除了需要引入更多种类的降维算法外也需要进一步评估集成降维算法与数据的关系,统计学的相关验证算法必不可少。此外,如何能更好地可视化降维前后的特征也是需要讨论的问题。医学领域不同于其他行业,图像的处理和模型的构建需要和临床医生的认知达到稳定的映射关系,这样才能使医生更好地理解模型和使用模型,也可以更方便地让患者理解病情从而配合治疗。目前特征工程中的特征仍以高维数字特征为主,除了传统的热图表征外还需要一种新式的特征表示方法,或许高维特征的可视化将从另一方面为智能医疗领域的算法更新做出新的贡献。除了特征工程外,机器学习建模算法也有提升的空间。RIAS平台目前提供传统模型参数的设定和最优搜索,但是还无法做到根据数据匹配最优模型。同时如何根据数据自动地初始化相对稳定的模型参数也是RIAS在未来要解决的问题。当然,随着更多更成熟的机器学习模型的提出,会在模型的效能层面有一定的提升。RIAS平台在深度学习算法上的提升空间相对较大。深度学习目前仍处于高速发展的阶段,随着越来越多研宄者跟进深度学习模型的探索队伍中,网络种类的多维构建将是趋势。目前RIAS在分类网络中只提供迀移学习训练模型,且在训练时提供了有限的网络参数设定。除此以外,RIAS没有引入更多的经典分类网络,用户的选择空间相对较少。同时在一些分类网络的底层优化上RIAS还有很多不足,对于效能不好的分类网络如何做到进一步优化也是要解决的问题。在分割网络上,RIAS目前只采用Unet结构。当然除了Unet外,也有越来越多的适用于医学图像的分割网络被提出,比如生成对抗网络等。对于分割网络来说,RIAS需要解决更多原理层上的算法优化和改良。由于医学影像组学多为DICOM格式,因此采用原始数据直接构建深度学习模型同样是需要解决的问题。RIAS虽然能够提供较多的功能,但是没有独立的、规范化的ROI勾画平台。ISD平台和AK平台均有独立的ROI勾画部分,虽然ROI的勾画可以借用3Dslicer或HK-snap等软件解决,但是也只能在科学研宄中使用。未来影像组学真正的临床应用仍需要成熟、稳定的自主勾画平台。同时RIAS目前没有良好的数据库构建系统,无论进行研宄或诊断只能借助外部数据空间进行相关操作。缺少数据库将对RIAS平台中临床诊断的功能造成较大的影响,因此如何合理规划、建设后台数据库依然是重大的挑战。本章主要在算法、功能、工程等方面对RIAS平台进行全面的评估和总结,重点论述了RIAS在相关方向的不足和可提升的空间。通过分析自身平台的优势、劣势,进一步引出未来RIAS平台将要重点探索、改革的方向。通过逐步解决RIAS平台现有的不足和劣势,将会更快地让更多医学研宄者借助AI软件参与到智能医疗领域,并为该领域做出新的突破和贡献。
该论文为收费论文,请扫描二维码添加客服人员购买全文。
以上论文内容是由
硕士论文网为您提供的关于《基于机器学习的医学影像研究与辅助诊断平台》的内容,如需查看更多硕士毕业论文范文,查找硕士论文、博士论文、研究生论文参考资料,欢迎访问硕士论文网医学论文栏目。