限定场景下图像语义理解及分割的研究与应用
发布时间:2021-01-15 12:09
图像语义分割技术其目的是为图像中每个像素分配类别标签,由于此项技术与无人驾驶等多种智能应用密切相关,因此成为了计算机视觉中一个研究热点。深度学习的迅速发展推动语义分割领域的研究取得突破性进展,使用卷积神经网络进行语义分割的方法效果远远好于其他方法,通过不断探索及研究该领域中深度学习算法后发现:卷积神经网络中大量的卷积和池化操作缩小了图像的分辨率,导致像素一定程度上失去了空间信息,并且由于神经网络以像素为单位进行特征提取及学习,缺少对图像的整体理解,现有网络在物体所属类别的分类上表现仍然有所欠缺。基于以上问题,本研究使用场景上下文编码模块,通过对自然场景中图像所包含的场景信息进行编码学习。该方法图像分割与图像中的场景紧密的联系起来,从全局理解图像的语义并且利用图像场景中的图像语义信息来指导语义分割任务。从而使得整体的像素分类更加合理,分割结果更加准确,具体的研究内容如下:(1)本研究提出了基于限定场景上下文编码的语义分割网络,网络中融合了一个场景编码模块。利用图像中的场景信息对理解图像中像素的对象类别提供帮助,并且能够通过场景信息将图像像素的类别分类限制在符合场景信息的类别上。(2)通过...
【文章来源】:北方工业大学北京市
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
语义分割在医学领域的分割示意图
叫?惶岢觥5?芯恐蟹⑾郑??绮?数的增加并不能持续地优化其性能,相反随着网络的加深,反向传播的梯度逐渐消失,模型的准确率开始下降,网络的收敛速度也大大减慢。2015年,一个被称为残差网络[13](ResidualNetwork,ResNet)的特征提取模型由何凯明及其团队所提出,该网络的作者基于计算机视觉领域中的残差表达的原理将其应用于构建CNN的模型。残差网络是由被称为残差块(ResidualBlock)的基本单元构成,其的主要特点是在网络中添加了跳跃连接,通过多层卷积之间输入于输出之间的残差来进行特征学习。残差块的组成如图1-2所示。实验中表明残差结构能够有效避免梯度消失的问题。图1-2残差块结构图实际的残差网络中,使用的残差结构称为瓶颈结构(BottleNeckBlock),不同数量的BottleNeckBlock结合组成残差网络。从浅至深有ResNet18、ResNet34、ResNet50、ResNet101、ResNet152。由于越深的网络训练耗时越长,而浅层网络性能有所欠缺,实际应用中常用ResNet50、ResNet101作为特征提取网络。1.2.2图像分割研究现状在图像分割的研究领域中,由于卷积神经网络具有高效率的学习性能,受到了众多学者的青睐,不仅成为了研究中的热点,并且在实际中得到了广泛的应用。除卷积神经网络外,循环神经网络(RecurrentNeuralNetwork,RNN)具有能够通过处理历史信息进而进行建模的特点,在一些与时间序列相关的问题上总会RNN的身影,因此在图像处理中RNN通常用于对图像的上下文信息进行捕获。传统模型通常面临欠拟合或过拟合的问题,生成对抗网络(GenerativeAdversarialNetworks,GAN)通过生成器和判别器两个模型之间的相互对抗,具有更好的学习能力,避免了此类问题,因此逐渐在语义分割的研究中流行起来。总体上讲,
第二章语义分割相关知识概述9层,同一层内结点相互独立。图2-1简易神经网络模型图每个结点对应的计算公式如(2-2)所示:{1(2)=(1(2))=(11(1)1+12(1)2+1(1))2(2)=(2(2))=(21(1)1+22(1)2+2(1))3(2)=(3(2))=(31(1)1+32(1)2+3(1))(2-2)输出层对应计算公式如(2-3)所示:()=(11(2)1(2)+12(2)2(2)+13(2)3(2)+1(2))(2-3)神经网络每一层相对于前一层学习到了更多的特征,网络因此可以表达更深层次的特征,能够更准确地进行预测。因此多层神经网络模型逐渐被普遍运用。为了实现更复杂的任务,需要提取的特征数量不断增加,研究者们在神经网络中不断堆叠隐藏层,神经网络的结构走向复杂化,训练过程中计算量大且整体耗时长。2.1.2反向传播神经网络的学习过程实际上是对网络中的参数寻求最优解的问题,通常情况下可由梯度下降法重复进行迭代完成最优化过程。但是因为神经网络包含多个神经元,对应包含多个参数,依照链式法则计算每个参数的梯度计算量则过大。因此,反向传播方法被应用于神经网络中以解决计算量过大的问题。反向传播算法属于监督式算法[24][25]按照网络结构,反向传播算法使用链式法则从后往前反向计算出每一层的梯度,根据梯度自动更新网络中的权值和偏差,每一次参数的变化都将以反向传播这种方式传递送到网络各层,这便可以让网络的输出值逐渐达到使用者的期望。反向传播算法两个步骤组成:第一步,激励传
【参考文献】:
期刊论文
[1]基于颜色和空间距离的显著性区域固定阈值分割算法[J]. 钱堃,李芳,文益民. 计算机科学. 2016(01)
[2]基于HSI和LAB颜色空间的彩色图像分割[J]. 庞晓敏,闵子建,阚江明. 广西大学学报(自然科学版). 2011(06)
[3]移动机器人目标分割及测距方法研究[J]. 沈春生,王耀南. 计算机工程与应用. 2011(23)
[4]Unit-Linking PCNN和图像熵的彩色图像分割与边缘检测[J]. 谭颖芳,周冬明,赵东风,聂仁灿. 计算机工程与应用. 2009(12)
[5]基于形态学梯度重构和标记提取的分水岭图像分割[J]. 王宇,陈殿仁,沈美丽,吴戈. 中国图象图形学报. 2008(11)
[6]基于区域生长法的图像分割技术[J]. 陈方昕. 科技信息(科学教研). 2008(15)
[7]梯度下降法[J]. 刘颖超,张纪元. 南京理工大学学报(自然科学版). 1993(02)
本文编号:2978847
【文章来源】:北方工业大学北京市
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
语义分割在医学领域的分割示意图
叫?惶岢觥5?芯恐蟹⑾郑??绮?数的增加并不能持续地优化其性能,相反随着网络的加深,反向传播的梯度逐渐消失,模型的准确率开始下降,网络的收敛速度也大大减慢。2015年,一个被称为残差网络[13](ResidualNetwork,ResNet)的特征提取模型由何凯明及其团队所提出,该网络的作者基于计算机视觉领域中的残差表达的原理将其应用于构建CNN的模型。残差网络是由被称为残差块(ResidualBlock)的基本单元构成,其的主要特点是在网络中添加了跳跃连接,通过多层卷积之间输入于输出之间的残差来进行特征学习。残差块的组成如图1-2所示。实验中表明残差结构能够有效避免梯度消失的问题。图1-2残差块结构图实际的残差网络中,使用的残差结构称为瓶颈结构(BottleNeckBlock),不同数量的BottleNeckBlock结合组成残差网络。从浅至深有ResNet18、ResNet34、ResNet50、ResNet101、ResNet152。由于越深的网络训练耗时越长,而浅层网络性能有所欠缺,实际应用中常用ResNet50、ResNet101作为特征提取网络。1.2.2图像分割研究现状在图像分割的研究领域中,由于卷积神经网络具有高效率的学习性能,受到了众多学者的青睐,不仅成为了研究中的热点,并且在实际中得到了广泛的应用。除卷积神经网络外,循环神经网络(RecurrentNeuralNetwork,RNN)具有能够通过处理历史信息进而进行建模的特点,在一些与时间序列相关的问题上总会RNN的身影,因此在图像处理中RNN通常用于对图像的上下文信息进行捕获。传统模型通常面临欠拟合或过拟合的问题,生成对抗网络(GenerativeAdversarialNetworks,GAN)通过生成器和判别器两个模型之间的相互对抗,具有更好的学习能力,避免了此类问题,因此逐渐在语义分割的研究中流行起来。总体上讲,
第二章语义分割相关知识概述9层,同一层内结点相互独立。图2-1简易神经网络模型图每个结点对应的计算公式如(2-2)所示:{1(2)=(1(2))=(11(1)1+12(1)2+1(1))2(2)=(2(2))=(21(1)1+22(1)2+2(1))3(2)=(3(2))=(31(1)1+32(1)2+3(1))(2-2)输出层对应计算公式如(2-3)所示:()=(11(2)1(2)+12(2)2(2)+13(2)3(2)+1(2))(2-3)神经网络每一层相对于前一层学习到了更多的特征,网络因此可以表达更深层次的特征,能够更准确地进行预测。因此多层神经网络模型逐渐被普遍运用。为了实现更复杂的任务,需要提取的特征数量不断增加,研究者们在神经网络中不断堆叠隐藏层,神经网络的结构走向复杂化,训练过程中计算量大且整体耗时长。2.1.2反向传播神经网络的学习过程实际上是对网络中的参数寻求最优解的问题,通常情况下可由梯度下降法重复进行迭代完成最优化过程。但是因为神经网络包含多个神经元,对应包含多个参数,依照链式法则计算每个参数的梯度计算量则过大。因此,反向传播方法被应用于神经网络中以解决计算量过大的问题。反向传播算法属于监督式算法[24][25]按照网络结构,反向传播算法使用链式法则从后往前反向计算出每一层的梯度,根据梯度自动更新网络中的权值和偏差,每一次参数的变化都将以反向传播这种方式传递送到网络各层,这便可以让网络的输出值逐渐达到使用者的期望。反向传播算法两个步骤组成:第一步,激励传
【参考文献】:
期刊论文
[1]基于颜色和空间距离的显著性区域固定阈值分割算法[J]. 钱堃,李芳,文益民. 计算机科学. 2016(01)
[2]基于HSI和LAB颜色空间的彩色图像分割[J]. 庞晓敏,闵子建,阚江明. 广西大学学报(自然科学版). 2011(06)
[3]移动机器人目标分割及测距方法研究[J]. 沈春生,王耀南. 计算机工程与应用. 2011(23)
[4]Unit-Linking PCNN和图像熵的彩色图像分割与边缘检测[J]. 谭颖芳,周冬明,赵东风,聂仁灿. 计算机工程与应用. 2009(12)
[5]基于形态学梯度重构和标记提取的分水岭图像分割[J]. 王宇,陈殿仁,沈美丽,吴戈. 中国图象图形学报. 2008(11)
[6]基于区域生长法的图像分割技术[J]. 陈方昕. 科技信息(科学教研). 2008(15)
[7]梯度下降法[J]. 刘颖超,张纪元. 南京理工大学学报(自然科学版). 1993(02)
本文编号:2978847
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2978847.html
最近更新
教材专著