当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的胸部X光片分类及胸部病变定位方法研究

发布时间:2020-04-23 04:12
【摘要】:肺癌在世界范围内都是发病率及死亡率较高的癌症之一。2015年,肺癌新发病例在中国约429.2万新发癌症病例中占17.1%(73.3万例),死亡病例占总体癌症死亡病例的21.1%(61万例/281.4万例),在中国肺癌已成为因癌致死的主要疾病。罹患肺癌的原因复杂,涉及基因及遗传改变。虽然近年来随着公众健康知识的整体提高,环境污染、空气污染的改善,医疗水平的提高以及临床有效药物的使用,肺癌的治疗效果有了很大的提高。但晚期肺癌患者的死亡率仍处在较高的水平,所以早期诊断成为肺癌防治的关键。临床肺癌初步筛查主要是依靠影像学证据判断,常见检查方式有胸部X光片与计算机断层扫描。计算机断层扫描(Computer Tomography,CT)是采用计算机控制下的X射线通过人体组织显现出不同密度影像来进行对比诊断,较传统胸部X射线图像有着灵敏度高、误诊率低等特点。由于X射线本身有使基因突变的潜在可能,所有有学者认为CT检查存在患者接受射线辐射量较高等风险。相较CT检查,X光片检查具有辐射量小、检查费用低廉、设备普及等优势,尤其是在第三世界经济欠发达国家,X光片检查更易于普通人群接受。所以X光片检查在实际临床肺癌筛查、相关肺部疾病的诊断工作中仍具有一定的意义。图像识别是利用计算机算法对图像进行处理分析,从而达到识别不同目标与对象的技术。图像识别一直以来都是计算机视觉研究的一个重要方向。图像识别定位技术可以有效处理特定目标的检测和识别,可以对图像进行分类及目标定位判断。目前图像识别技术在图像搜索、目标行为分析、无人机、自动驾驶等高新产业与生物医学、地质学等很多学科都有广阔的应用前景。图像识别早期主要采用方向梯度直方图(Histogram of oriented gradients,HOG)、尺度不便特征变换(Scale invariant feature transform,SIFT)等一些特征提取方法,将提取到的特征通过分类器进行分类识别。该类方法的特征提取工作是主观手工设计的,不同的应用、特征的不同选择都会对整体系统的性能产生直接影响。早期图像识别任务都是针对特定识别对象的,不具有泛化能力,并且样本规模较小,在实际应用中难以达到较高的识别要求。近年来,随着机器学习技术的发展,将机器学习技术应用于图像识别任务的成功案例越来越多。深度学习属于机器学习的研究范畴,给机器学习带来新一轮浪潮。深度学习在图像识别领域、语音识别方面均取得了重大突破,解决了传统BP神经网络加深后的梯度弥散问题,使图像识别中的特征提取由人工设计转化为自动获取。机器学习辅助胸片诊断研究可分为2部分研究任务,一部分为:含有病变的阳性胸片与无病变的阴性胸片的分类方法研究;另一部分是阳性胸片中的病变检测定位方法研究。本文就全面分析可用于以上两项任务的模型的基础上,用重新设计分类网络、优化建议框生成策略、加入新功能层、使用有效激活函数、特征提取网络替换、梯度信息动态修正、二阶优化算法、影响函数算法的思想,提出了3个新胸片分类模型、3个新胸片病变检测模型。研究结果表明,本文所提出的新模型,可以更好的适用于胸片分类任务与胸片病变检测任务,拓展了计算机辅助胸片诊断的应用范围与深度。论文的主要研究内容和结果包括以下几个方面:(1)针对胸片分类任务,对传统机器学习算法与深度学习算法进行了研究,针对图像数据过大问题,对主成分分析法在胸片分类任务中的应用进行了研究。其次针对传统机器学习算法难于理解二维图像信息这一问题进行了分析,提出使用基于卷积的深度学习网络进行胸片分类任务,考虑到深度网络分类层神经元数量变化剧烈问题,重新设计了全连接层,提出了FC-migreatd-ResNet深度分类模型,该模型在胸片分类数据库上的较强分类性能通过实验得到了验证,分类效果优于传统机器学习模型与原深度分类模型。(2)针对胸片病变检测任务,对Fast-RCNN模型进行了研究,该模型中的多任务网络中通过使用Dropout策略去降低模型对训练集发生过拟合的可能性,为了提高模型的病变检测性能,受到Inception网络的启发,本文提出VGG-19-BN模型,该模型去除了Dropout策略,加入了Batch Normalization层,使得多任务网络中的各层输出标准化,降低了不同样本间的差异性。新模型在胸片病变数据库中得到了验证,相较原Fast-RCNN模型提高了病变检测性能。(3)针对胸片病变检测任务,对Faster-RCNN模型进行了研究,该模型使用卷积RPN网络生成用于训练网络的建议框,原算法中的9-anchors建议框生成策略会产生过多的低质量建议框,降低了模型病变检测效果,本文首先对胸片病变数据库中的标注框进行了统计,提出了4-anchors建议框生成策略,其次,对比了ResNet与VGG两种特征提取网络在特征提取任务中的性能,最终提出ResNet-4anchors胸片病变检测模型。通过对胸片病变数据库中的病变检测,新模型较原模型病变检测性能提升明显。(4)针对高阈值病变检测任务,对YOLO三种模型进行了研究。使用胸片病变数据库进行了优势模型对比,结果显示YOLOv3模型在高阈值病变检测任务中检测性能更高。为了更好的完成高阈值病变检测任务,降低病变漏检率,通过对YOLOv3网络结构分析,发现多个卷积层特征图数量减少过快,有丢失信息的可能,于是加入多个卷积核为1 × 1的卷积层,提出了YOLOv3-domain目标检测网络,新模型在胸片病变数据库上得到验证,新模型高阈值病变检测性能较原网络有提高。(5)针对胸片分类任务,对用于神经网络参数训练的梯度下降法、数值优化中的二阶优化算法进行了研究,为了能更有效的训练神经网络,提高模型预测性能,本文提出了一种利用梯度信息带修正策略的二阶优化算法HFGCSO,新算法综合了网络参数的一阶、二阶信息,考虑了两种信息的空间关系,使神经网络的参数训练更为有效。HFGCSO算法在两种数据集上得到了验证,新算法较梯度下降算法,原二阶优化算法的分类准确率更高。(6)针对胸片分类任务,对影响函数进行了研究,为了提高深度分类网络的可解释性,本文利用影响函数对胸片分类数据集进行了定量分析,得到单一训练样本对深度分类模型的影响值,并据此从训练集层面对深度的分类模型的预测行为进行了解释。为了提高传统机器学习模型的分类性能,提出剪裁训练策略,通过该策略训练得到的模型分类准确率有提高,新策略在胸片分类数据集上对三种机器学习分类模型均有效。神经网络模仿了人脑神经元,在很多任务中都显示出接近甚至超出人类的决策判断能力。利用神经网络进行医学影像辅助诊断是本文的研究初衷,对多种分类机器学习算法以及目标检测算法的改进是本文的研究内容。旨在提高计算机辅助诊断在医学影像诊断中的应用价值,为加速计算机辅助诊断普及提供技术准备。
【图文】:

影像,中位,影像,坐标


逦h视诨餮暗男夭浚毓馄掷嗉靶夭坎”涠ㄎ环椒ㄑ芯垮义希恚礤义贤迹玻毙仄菘獾慕㈠义希ǎ幔〇埽簰,

本文编号:2637340

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2637340.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cb5d9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com