基于深度学习的病理图像细胞核分割
发布时间:2020-11-12 10:19
病理图像的细胞核分割对于癌症诊断、评级、预后具有重要意义,尽管基于深度神经网络的全监督的病理图像细胞核分割取得了瞩目的成绩,但是基于全监督的神经网络分割要求对病理图像进行像素级的标注,标注量巨大,标注成本过高。而且由于不同组织的不同癌症的病理图像的细胞核在颜色、形态上等存在差异,跨病种跨组织的病理图像分割也是一个巨大挑战。本文提出一种基于检测框的弱监督的跨组织的不同癌症的病理图像细胞核分割框架,该方法首先运用水平集、图割、分水岭方法、测地线距离昂发、直接画圆和框的6种方法生成伪标签,伪标签的生成结果表明水平集方法、直接画圆和框能取得很好的结果,与精标注的数据相比,其中水平集方法达到dice=0.8790的精度。其次,我们对比了fcn、deeplabv3+、unet等6种网络结构在不同组织的癌症的病理图像细胞核分割结果,提出了我们自己的分割网络DB-unet,分割结果表明在参数量更少的情况下,我们的网络基本达到全监督分割的最好结果。之后,我们运用DB-unet和生成的伪标签进行弱监督下的不同组织的癌症的病理图像细胞核分割,其中结果表明水平集方法和测地线距离的方法的结果最好。最后我们选择最好的三个网络和最好的伪标签,运用集合的方法去迭代融合伪标签,我们运用不同网络和不同的伪标签去训练和产生结果,将产生的结果与原伪标签相加,得到最终融合伪标签,融合伪标签的dice精度达到0.8922,最终用融合的伪标签训练去本文提出的DB-Unet,训练的网络基本达到了精确标注的标签训练的网络同等的精度。结论:在本文提出一种基于检测框的弱监督的跨组织的不同癌症的病理图像细胞核分割框架下,细胞核的分割基本达到全监督分割结果,这大大降低了数据的标注成本,同时也为细胞核分割提供新思路。
【学位单位】:电子科技大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:R730.4;TP391.41;TP18
【部分图文】:
电子科技大学硕士学位论文122.2.1神经元模型神经网络由最基本的单位“神经元”组成得,在科学家和生物学家的不断努力下,在1904年时,神经元的结构组成就已经被人类所破解,所以今天的神经网络是模拟生物学上神经元的信息传递过程,一个神经元包括多个树突,这些树突是用来接受信息的,而神经元只有一条轴突,轴突有很多轴突末梢,轴突末梢将于其他神经元的树突相连,这样这些末梢将信息传递给其他的多个神经元,在生物学上轴突和树突的连接叫“突触”[67]。如下图图2-2所示:图2-2生物学上的神经元1943年心理学家McCulloch和数学家Pitts,通过研究生物神经元,将上图类似的生物神经元抽象为神经元模型,也就是MP神经元模型,并且是至今日一直沿用。下图是抽象出来的神经元模型:SumSgn3x2x1x1w2w3wy图2-3抽象的MP神经元模型
电子科技大学硕士学位论文16信号,树突的权重就做突触的权值,与接受的信号会相乘。这样在生物神经元结果中信号会在下个神经元中不断积累,当达到某一阈值时,神经元向轴突传递信号,如果未能达到这个阈值,则信号被屏蔽杀死。那么激活函数,相当于一个阈值选择器,决定信号是否需要传递,当然真实的激活函数是将神经网络的线性输出变成非线性的。激活函数分类其实很简单,一般分为线性激活函数和非线性激活函数。非线性激活函数包括Sigmoid、Tanh、LReLU、ReLU、Softmax等[69]。2.2.3.1线性激活函数线性激活函数的输出是线性的,从输入到输出的值不会出现变化,即为一次线性函数,其公式为:f(x)=x,函数图像如下所示:图2-5线性激活函数图2.2.3.2非线性激活函数1、Sigmoid激活函数又被称之为Logistic激活函数,如图2-6的函数所示,它将神经网络输出的数值压缩进0到1的区间内,经过该函数的输出会大于0而小于1,当输入值足小于零且这个值这越小,该函数尽量让输出数值靠近0,对于大的正数而言,该函数尽量让输出数值靠近1,其数学公式如下:()11xxe=+(2-23)Sigmoid函数图如下:
第二章相关理论和背景知识介绍17图2-6Sigmoid激活函数图Sigmoid存在以下的缺点:梯度消失问题,神经网络输出上使用sigmoid激活函数时,在误差反向传播阶段,当网络的输出接近0或者1时,我们对误差进行求梯度时,梯度趋近于0。这样神经元的权重不会更新或者更新可忽略不计,此外于此相连的权重也会更新很慢,当向前传播几层后梯度可能等于0,该问题叫梯度消失。当然sigmoid的计算成本高而且不以0为中心也算缺陷。2、Tanh函数又叫双曲正切激活函数,其实它与sigmoid函数很相似,不同之处在于Tanh将输出压缩到-1到1之间,并且在输出的中心上,函数输出是以0为中心。由于函数类似sigmoid,其也存在梯度消失的缺点。其公式如下:()tanh()xxxxeefxxee==+(2-24)其函数图像如下:
【参考文献】
本文编号:2880628
【学位单位】:电子科技大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:R730.4;TP391.41;TP18
【部分图文】:
电子科技大学硕士学位论文122.2.1神经元模型神经网络由最基本的单位“神经元”组成得,在科学家和生物学家的不断努力下,在1904年时,神经元的结构组成就已经被人类所破解,所以今天的神经网络是模拟生物学上神经元的信息传递过程,一个神经元包括多个树突,这些树突是用来接受信息的,而神经元只有一条轴突,轴突有很多轴突末梢,轴突末梢将于其他神经元的树突相连,这样这些末梢将信息传递给其他的多个神经元,在生物学上轴突和树突的连接叫“突触”[67]。如下图图2-2所示:图2-2生物学上的神经元1943年心理学家McCulloch和数学家Pitts,通过研究生物神经元,将上图类似的生物神经元抽象为神经元模型,也就是MP神经元模型,并且是至今日一直沿用。下图是抽象出来的神经元模型:SumSgn3x2x1x1w2w3wy图2-3抽象的MP神经元模型
电子科技大学硕士学位论文16信号,树突的权重就做突触的权值,与接受的信号会相乘。这样在生物神经元结果中信号会在下个神经元中不断积累,当达到某一阈值时,神经元向轴突传递信号,如果未能达到这个阈值,则信号被屏蔽杀死。那么激活函数,相当于一个阈值选择器,决定信号是否需要传递,当然真实的激活函数是将神经网络的线性输出变成非线性的。激活函数分类其实很简单,一般分为线性激活函数和非线性激活函数。非线性激活函数包括Sigmoid、Tanh、LReLU、ReLU、Softmax等[69]。2.2.3.1线性激活函数线性激活函数的输出是线性的,从输入到输出的值不会出现变化,即为一次线性函数,其公式为:f(x)=x,函数图像如下所示:图2-5线性激活函数图2.2.3.2非线性激活函数1、Sigmoid激活函数又被称之为Logistic激活函数,如图2-6的函数所示,它将神经网络输出的数值压缩进0到1的区间内,经过该函数的输出会大于0而小于1,当输入值足小于零且这个值这越小,该函数尽量让输出数值靠近0,对于大的正数而言,该函数尽量让输出数值靠近1,其数学公式如下:()11xxe=+(2-23)Sigmoid函数图如下:
第二章相关理论和背景知识介绍17图2-6Sigmoid激活函数图Sigmoid存在以下的缺点:梯度消失问题,神经网络输出上使用sigmoid激活函数时,在误差反向传播阶段,当网络的输出接近0或者1时,我们对误差进行求梯度时,梯度趋近于0。这样神经元的权重不会更新或者更新可忽略不计,此外于此相连的权重也会更新很慢,当向前传播几层后梯度可能等于0,该问题叫梯度消失。当然sigmoid的计算成本高而且不以0为中心也算缺陷。2、Tanh函数又叫双曲正切激活函数,其实它与sigmoid函数很相似,不同之处在于Tanh将输出压缩到-1到1之间,并且在输出的中心上,函数输出是以0为中心。由于函数类似sigmoid,其也存在梯度消失的缺点。其公式如下:()tanh()xxxxeefxxee==+(2-24)其函数图像如下:
【参考文献】
相关硕士学位论文 前1条
1 谢杨鑫;前列腺腺腔和腺泡细胞核的自动化分割识别[D];华南理工大学;2013年
本文编号:2880628
本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/2880628.html
最近更新
教材专著