基于神经网络的癌症筛查与诊断人工智能研究

发布时间：2020-08-20 18:20

【摘要】：癌症是人类健康的重大威胁。癌症早期筛查与诊断是公认的降低癌症死亡率的有效方法。但是,不断恶化的癌症形势与专业人员的相对紧缺是当前癌症形势下所面临的一对尖锐矛盾。而癌症的智能筛查与诊断为解决这一矛盾提供了有效途径。近年来,人工神经网络特别是深度神经网络算法,在人工智能的各个领域取得了引人注目的成绩。而这种以数据为驱动的机器学习算法需要从大量的数据中进行学习。随着医疗信息化的不断深入,医疗行业数据量增长迅速。医疗数据的不断积累与人工神经网络的不断发展为癌症的智能筛查与诊断提供了有力的材料和工具。本论文主要对癌症的智能筛查与诊断进行研究。在深入研究医疗数据的特点并广泛分析相关研究工作的基础之上,本论文提出了一系列用于癌症智能筛查与诊断的神经网络模型,并在多个公开数据集上进行了性能评估与验证。具体而言,本论文的主要研究工作和成果包括:提出了多视野卷积神经网络(Multi-view Convolutional Neural Networks,MV-CNN)用于肺部CT的肺结节智能诊断。CT图像有两个特点。第一个特点就是病灶占整个图像很小的一部分,并且会影响周边的组织结构,所以病灶的周边组织环境也可以为医疗图像的诊断提供有效信息。针对这一点,提出了多视野卷积神经网络。该模型在输入层采用了多个信道,每个信道对应一个不同的视野。利用这个模型在 LIDC-IDRI(Lung Image Database Consortium and Image Database Resource Initiative)数据集上进行二分类(良性和恶性)和三分类(良性、原发恶性和转移恶性)的实验。二分类错误率为5.41%;三分类错误率为13.91%。与其他在这个数据集上的研究相比取得了更好的分类效果。CT图像第二个特点是由很多切片组成,这些切片连接起来描绘了内部器官的立体结构。针对这一特点,对上述模型进行了改进,提出了3D多视野卷积神经网络。该模型将数据和网络构架组织成3D模式,使得卷积在三个维度上进行滑动,从而能够提取肺结节三个空间维度上的特征。与其他相关研究不同的是,网络构架采用了 Inception模块的3D变体。在同样的数据集上,该模型对于二分类错误率降低为4.59%,对于三分类错误率降为7.70%。提出了适用于提高结构化数据分类性能的全连接层在前的卷积神经网络(Fully Connected Layer First Convolutional Neural Net-works,FCLF-CNN)用于基于细胞学特征的乳腺癌诊断。FCLF-CNN将全连接层置于卷积层之前,其作用在于将结构化数据转化为具有更好局部结构的数据表示。在实际操作中,该模型对卷积层之前的全连接层施加了两种损失函数,同时对应了两种网络构架。一种是softmax损失函数,对应1DFCLF-CNN构架;一种是均方差损失函数,对应2D FCLF-CNN构架。然后每种构架采用同时训练和分阶段训练的两种方式分别进行训练。4个FCLF-CNN的集成模型在WDBC数据集上的交叉验证取得了 98.71%的准确率、97.60%的敏感度和99.43%的特异性,在WBCD数据集上取得了99.28%的准确率、98.65%的特异性和99.57%的敏感度。与其他在这两个数据集上的研究相比取得了更好的结果。基于提出的FCLF-CNN,以血常规、尿常规及肿瘤标记物为特征,用于基于无症状的癌症筛查。并在极度非均衡场景下,设计了硬分类器和软分类器相结合的方法输出筛查结果。基于无症状的癌症筛查面向的是极度不均衡的场景。通过理论和实验的方法证明了硬分类器和软分类器都会受类别不均衡程度的影响。所以基于极度非均衡场景,设计了一种新的硬分类器和软分类器相结合的方法输出筛查结果。对于硬分类器,使用了最大互信息原则进行阈值的选择。对于软分类器,采用将得分对应的虚警率、漏报率和PPV同时输出的策略。核心模型采用了本论文中提出的FCLF-CNN,并将其应用于肺癌、肝癌、乳腺癌、宫颈癌及肾癌的筛查。与其他相关研究相比,其中肺癌和肝癌的模型获得了更有竞争力的筛查性能,其AUC分别达到了 0.8887与0.9432。
【学位授予单位】：北京邮电大学
【学位级别】：博士
【学位授予年份】：2018
【分类号】：R730.4;TP18
【图文】：

示意图,生物神经元,计算单元,示意图

感知器灵感来自于大脑［２７］３８６。大脑的基本计算单元是神经元。每个神经元从树逡逑突接收输入信号并沿着轴突产生输出信号。轴突最终分叉并通过突触连接到其他神逡逑经元的树突。图２－２的左半部分展示了－个生物神经元的示意图。而在图的右半部逡逑份展示了一个ＭＬＰ的计算单元＿。这个计算单元往往也被称为神经元。一个神经逡逑元会有多个输入，如果把每个输入看作一个向量的元素，那么每个一个神经元的输逡逑入就是一个向量ａ：每个元素而会乘以其对应的权重叫，而叫逡逑是可学习的。权重控制着一个神经元对另一个神经元的控制强度和方向。所有的输逡逑入通过加权进入神经元以后再求和。如果这个和大于某个阈值信号就继续发送。在逡逑感知器中，用激活函数来模拟这个功能。这个激活函数往往是一个非线性的函数。逡逑本章用５来表示激活函数。所以一个神经元的计算过程可以表示为：逡逑ｎ逡逑ｙ邋＝邋ｗｉｘｉ邋＋ｂ）逦（２－１）逡逑ｉ＝ｌ逡逑其中ｙ表示这个神经元的输出，称为偏置（ｂｉａｓ）。逡逑秦—逡逑图２－２：邋—个生物神经元的示意图（左）以及ＭＬＰ中的一个计算单元（右）逡逑单层感知器只能解决线性分类问题，ＭＬＰ通过增加网络层数来增加网络表示的逡逑能力，从而可以处理更复杂的非线性分类的问题［９３１。所以ＭＬＰ由多层构成，每个逡逑层包含很多神经元。一个神经元的输出作为下一层神经元的输入。如果一个神经元逡逑的输出是另■一个神经元的输入，那么就认为这两个神经元之间有连接。传统的ＭＬＰ逡逑中同一层的yL经元之间不存在连接

局部连接,全连接

５？逡逑：媭~寪`邋＾■１邋Ｘ．邋１＾７１８邋＾７７８邋￣９９邋￣５０逡逑＼丨２２８丨２２０丨２２９丨邋２１１邋丨邋１６３！邋：１２逡逑图２￣４：数字图像及像素强度逡逑形状特征等。方向梯度直方图及局部二值模式是常用的全局特征提取方法。局部逡逑特征是从图像的局部区域中抽取的特征，包括边缘、角点和特别属性的区域等。逡逑局部特征提取方法有邋ＳＵＲＦ邋（Ｓｐｅｅｄｅｄ邋Ｕｐ邋Ｒｏｂｕｓｔ邋Ｆｅａｔｕｒｅｓ）及邋ＳＩＦＴ邋（Ｓｃａｌｅ邋Ｉｎｖａｒｉａｍ逡逑Ｆｅａｔｕｒｅ邋Ｔｒａｎｓｆｏｒｍ）等。为了与ＣＮＮ相区别，这些特征提取的方法往往被称之为手逡逑工（ｈａｎｄ－ｃｒａｆｔｅｄ）设计的特征提取方法。认知层和情感层的图像内容是语义层次的逡逑特征，是对低层视觉特征到高级语义的映射［９４１。逡逑２．１．３．２卷积神经网络逡逑卷积神经网络的灵感来自于Ｈｕｂｅｉ等人在研宄猫脑皮层时所提出的感受野逡逑（ｒｅｃｅｐｔｉｖｅ邋ｆｉｌｅｄ）的理论感受野的理论认为人对外界事物的感知是从局部到全逡逑局的，而图像的空间联系也是局部的像素联系紧密，距离较远的像素相关性较弱。逡逑而卷积神经网络相邻层之间的连接是局部连接。具体到每个神经元，只需要对局部逡逑的图像块进行感知，而不需要对全局的图像进行感知（如图２－５所示）。除了局部逡逑迕接，卷积神经网络的相邻层之间也是权值共享的，即Q嫞孕诺乐蔚娜ㄖ凳窍噱义贤摹Ｕ庋龀舜锏铰瞬ê吞卣魈崛〉模车

本文编号：2798290

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2798290.html

上一篇：饱和受限T-S模糊Markov跳变系统的稳定性分析与控制器设计
下一篇：基于光纤Φ-OTDR的振动信号采集分析研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|