基于深度神经网络的慢性创面图像分割与识别方法研究
发布时间:2022-01-25 18:23
精准医疗是目前深度学习在医疗领域中的一项重要应用,它通过深度学习方法对病灶部位进行处理,获取精确的处理结果,进而辅助医生对病人的病情进行诊断和后续治疗。慢性创面是典型的慢性疾病,难以短期治愈,往往占用大量医疗资源。这给病人造成身体上和精神上的巨大伤害,也加重医生的工作量。如果能实现慢性创面的精准医疗,就可以减轻病人的痛苦,减少医疗资源的浪费,减轻医生的工作量。为了实现这个目标,需要对慢性创面区域实现准确分割与识别。本文为了实现慢性创面区域准确分割与识别这一目标,提出了一个基于深度神经网络的慢性创面图像分割与识别的系统化方法。具体工作可以概括为以下三个方面:(1)提出了基于GANs的慢性创面图像生成器。针对慢性创面图像数据集数量不足而导致慢性创面区域分割与识别准确率低的问题,本文提出了一个基于GANs的慢性创面图像生成器解决。它包含两个深度神经网络:一个生成慢性创面图像的生成器网络D以及一个判别是否为生成器网络D生成的慢性创面图像的判别器网络G。这两个网络对抗训练,达到平衡时获得慢性创面图像生成结果图像。该结果图像可以用于扩充后续分割与识别网络的训练集。实验结果表明,该方法与传统图像数据...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:67 页
【学位级别】:硕士
【图文】:
传统图像数据增强效果图(摘自文献[72])
国防科技大学研究生院硕士学位论文第10页图2.2GANs生成卧室图像(摘自文献[41])对抗式生成网络使用两个神经网络作基础网络模型,一个神经网络为生成器网络,另一个神经网络为判别器网络。全部的对抗训练过程如下:假设生成器为g(z),其中z是一个随机噪声。g的作用是将这个随机噪声z转化为另一种数据类型x。在图像生成领域,这个输出的数据类型x就是一张图像。D(x)是判别器。对于任何一个输入x,D(x)的输出是一个从0到1的实数。这个实数是用来判断这张图像是否为一张真实图像的概率。设Pr和Pg分别代表真实图像的分布和生成图像的分布情况。判别器模型的目标函数可以设定如下:max~log+~[log(1())](2.1)同样的,生成器网络的目的是使判别器网络无法判断生成器网络生成的图像和真实图像。所以生成器网络的目标函数可以设定如下:minmax~log+~[log(1)](2.2)这个最大最小目标函数的优化方法是交互式迭代D和g,固定g,优化D,接下来固定D,优化g,如此反复迭代直到收敛。具体情况如下图所示:
国防科技大学研究生院硕士学位论文第12页图2.4生成网络结构图网络结构的算法伪代码如下:算法2.1Image-Generator输入:100维随机向量。其中100维随机向量由随机数生成器生成输出:分辨率128×128的图像1、将输入经过全连接层进行全连接操作2、计算1中向量的反卷积操作结果(激活函数为ReLU)3、repeat24、repeat35、计算4中向量的带洞反卷积操作(参考3.2.2)结果6、repeat57、采用Tanh作为6的输出的激活函数,得到结果2.3.2判别器网络结构判别器网络是由五层卷积层和三层池化层组成。它的输入是生成器网络的输出,为128×128像素图。接下来经过两层卷积核为3×3,步长为2的带洞卷积操作,由此获得32×32×128维向量。接下来的网络结构为一层3×3,步长为1的卷积层和2×2的最大池化层[45]交替进行三次,直到获取一个4×4×1024维向量。网络的每个卷积操作层有一个批归一化层用来加快收敛速度,并且网络的激活函数为SeLU[46]。最后,全连接层将4×4×1024维向量连接成一个范围为0到1的数字,这个数字代表这张图像为真实图像或者生成图像的概率。其网络结构如下:
本文编号:3609014
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:67 页
【学位级别】:硕士
【图文】:
传统图像数据增强效果图(摘自文献[72])
国防科技大学研究生院硕士学位论文第10页图2.2GANs生成卧室图像(摘自文献[41])对抗式生成网络使用两个神经网络作基础网络模型,一个神经网络为生成器网络,另一个神经网络为判别器网络。全部的对抗训练过程如下:假设生成器为g(z),其中z是一个随机噪声。g的作用是将这个随机噪声z转化为另一种数据类型x。在图像生成领域,这个输出的数据类型x就是一张图像。D(x)是判别器。对于任何一个输入x,D(x)的输出是一个从0到1的实数。这个实数是用来判断这张图像是否为一张真实图像的概率。设Pr和Pg分别代表真实图像的分布和生成图像的分布情况。判别器模型的目标函数可以设定如下:max~log+~[log(1())](2.1)同样的,生成器网络的目的是使判别器网络无法判断生成器网络生成的图像和真实图像。所以生成器网络的目标函数可以设定如下:minmax~log+~[log(1)](2.2)这个最大最小目标函数的优化方法是交互式迭代D和g,固定g,优化D,接下来固定D,优化g,如此反复迭代直到收敛。具体情况如下图所示:
国防科技大学研究生院硕士学位论文第12页图2.4生成网络结构图网络结构的算法伪代码如下:算法2.1Image-Generator输入:100维随机向量。其中100维随机向量由随机数生成器生成输出:分辨率128×128的图像1、将输入经过全连接层进行全连接操作2、计算1中向量的反卷积操作结果(激活函数为ReLU)3、repeat24、repeat35、计算4中向量的带洞反卷积操作(参考3.2.2)结果6、repeat57、采用Tanh作为6的输出的激活函数,得到结果2.3.2判别器网络结构判别器网络是由五层卷积层和三层池化层组成。它的输入是生成器网络的输出,为128×128像素图。接下来经过两层卷积核为3×3,步长为2的带洞卷积操作,由此获得32×32×128维向量。接下来的网络结构为一层3×3,步长为1的卷积层和2×2的最大池化层[45]交替进行三次,直到获取一个4×4×1024维向量。网络的每个卷积操作层有一个批归一化层用来加快收敛速度,并且网络的激活函数为SeLU[46]。最后,全连接层将4×4×1024维向量连接成一个范围为0到1的数字,这个数字代表这张图像为真实图像或者生成图像的概率。其网络结构如下:
本文编号:3609014
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3609014.html