基于空洞卷积和噪声估计的图像去噪算法研究
发布时间:2021-02-25 14:57
随着互联网的发展和智能设备的普及,图像在生物医学、公共管理等领域发挥着重要作用。然而,由于环境、设备等多种因素影响,图像会不可避免地受到噪声污染,进而直接影响以计算机视觉为基础的相关研究。因此,研究如何有效对图像进行去噪,是计算机视觉领域至关重要的研究课题。近年来,基于卷积神经网络的去噪方法在快速发展的同时依旧面临诸多难题,如深层模型带来的巨大参数量影响实际工程应用、单流网络模型无法在有效去除噪声的同时保留图像本身的纹理特征、以及去噪模型无法同时处理多种类型噪声等问题。本文针对图像去噪算法面临的问题,结合空洞卷积和噪声估计,对基于深度学习的去噪方法从模型大小、图像视觉效果、多噪声处理能力三个方面进行了深入研究,有效提升了图像去噪性能。本文的主要工作如下:针对基于深度学习的图像去噪模型参数量过大的问题,提出一种基于编解码残差网络和空洞卷积的图像去噪算法。该算法使用了一个端到端的神经网络去噪模型,其核心模块相较于普通结构仅需要少量参数便可实现对图像特征的有效提取。同时,残差策略的加入使得正向信息传导和反向梯度传播的过程更为高效。实验分析验证了编解码模块、空洞卷积及残差策略的有效性,并证明了...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:124 页
【学位级别】:博士
【部分图文】:
图1-1?Jain等人提出的基于神经网络的去噪结构??2008年,Jain等人W第一次提出基于卷积神经网络的图像去噪方法
他们所提出的方法不需要结??构化的先验知识,网络的降噪能力纯粹通过学习获得。同时,由于不依赖先验知??识,SSDA同样可以用于其他诸如音频去噪、图像修复或数据预处理等任务。另??外,Xie还指出,SSDA模型的缺点在于它完全依赖于监督训练,即SSDA网络??只能处理训练时“见过”的噪声。这应该是所有基于深度学习方法的一个通玻??t?\??^?wmm?■■■?mtm?hm?mh??■、?'??^?amm?m?Mmm?hmb??!??AS?'??L?y??图1-2?—个简单的三层MLP模型??同一年,Burger等人[23]认为多层感知机(Multi-Layer?Perception,?MLP)模型??可以看作一个通用的函数逼近器,比CNN模型更具有普适性。因此,他们提出??了一个多层感知机模型去学习从噪声图像到无噪图像的映射。一般来说,一个包??含一层隐藏层的简单MLP模型结构(图1-2,浅绿色圆形代表神经元)可以用如??下式子表示:??f(x)?=?b2?+?W2a{b1?+?WlX)?(1-2)??其中,WYWa和61;62分别代表每层的权重矩阵和偏移值,a代表非线性激活??函数。在文中,他们经过实验采用的模型为包含四个尺寸为2017的隐藏层,并??且采用了?Sigmoid函数来作为非线性激活函数。另外,文中分别在数据、参数初??始化和学习率三个层面使用如下所述小技巧(tricks)来使反向传播更加有效率:??1.在数据层面,他们将图像数据归一化成均值为0且方差为1的分布。??2.在参数初始化层面,权值的获取方式为从方差为0标准差为\/1的正态分??6??
?浙江大学博士学位论文???认的解决方案为在网络中添加正则化。但是,添加正则化的深度模型虽然与之前??相比易于训练,但不可避免地遇到了退化问题,即网络层数增加反而导致性能变??差。???y?'???1X1卷积,64通道??ReLU?—?? ̄?1??3X3卷积,64通道?|??ReLU??T? ̄??1X1卷积,256通道???y?[???ReLU?? ̄T ̄??图1-3残差网络中一个残差单元??于是,He等人于2015年末提出了一种使用直接映射来连接不同网络层??的想法,并以此为基础提出了经典网络ResNet。ResNet网络核心在于深度残差??学习。对于一般的网络来说,单层通常可以看作y?=孖对于残差网络来说,??单层变成了?+?通过残差块,信息可以非常流畅地在高低层直接??传递。a:可以通过短路连接(shortcut?connection)来实现,如图1-3所示。短??路连接在ResNet中主要实现了恒等映射(identity?mapping),并在每一个残差块??中联结输入和输出。它的优势在于不增加额外的计算复杂度。通过残差连接,网??络层数可以达到惊人的152层。自此,卷积神经网络真正迈入深度时代。??受到ResNet思想的启发,Mao等人[2]于2016年提出了一种包含对称跳跃??连接的深度编解码网络RED来解决深度降噪摸型难以训练的问题。RED模型是??全卷积模型框架,即网络中不包含全连接层。图1-4为一个典型的10层RED模??型,包含5个卷积层(黄色方块)和5个反卷积层(橙色方块)。RED模型与之前??的方法相比,网络更深且去噪效果更好。该网络模型由大量
本文编号:3051138
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:124 页
【学位级别】:博士
【部分图文】:
图1-1?Jain等人提出的基于神经网络的去噪结构??2008年,Jain等人W第一次提出基于卷积神经网络的图像去噪方法
他们所提出的方法不需要结??构化的先验知识,网络的降噪能力纯粹通过学习获得。同时,由于不依赖先验知??识,SSDA同样可以用于其他诸如音频去噪、图像修复或数据预处理等任务。另??外,Xie还指出,SSDA模型的缺点在于它完全依赖于监督训练,即SSDA网络??只能处理训练时“见过”的噪声。这应该是所有基于深度学习方法的一个通玻??t?\??^?wmm?■■■?mtm?hm?mh??■、?'??^?amm?m?Mmm?hmb??!??AS?'??L?y??图1-2?—个简单的三层MLP模型??同一年,Burger等人[23]认为多层感知机(Multi-Layer?Perception,?MLP)模型??可以看作一个通用的函数逼近器,比CNN模型更具有普适性。因此,他们提出??了一个多层感知机模型去学习从噪声图像到无噪图像的映射。一般来说,一个包??含一层隐藏层的简单MLP模型结构(图1-2,浅绿色圆形代表神经元)可以用如??下式子表示:??f(x)?=?b2?+?W2a{b1?+?WlX)?(1-2)??其中,WYWa和61;62分别代表每层的权重矩阵和偏移值,a代表非线性激活??函数。在文中,他们经过实验采用的模型为包含四个尺寸为2017的隐藏层,并??且采用了?Sigmoid函数来作为非线性激活函数。另外,文中分别在数据、参数初??始化和学习率三个层面使用如下所述小技巧(tricks)来使反向传播更加有效率:??1.在数据层面,他们将图像数据归一化成均值为0且方差为1的分布。??2.在参数初始化层面,权值的获取方式为从方差为0标准差为\/1的正态分??6??
?浙江大学博士学位论文???认的解决方案为在网络中添加正则化。但是,添加正则化的深度模型虽然与之前??相比易于训练,但不可避免地遇到了退化问题,即网络层数增加反而导致性能变??差。???y?'???1X1卷积,64通道??ReLU?—?? ̄?1??3X3卷积,64通道?|??ReLU??T? ̄??1X1卷积,256通道???y?[???ReLU?? ̄T ̄??图1-3残差网络中一个残差单元??于是,He等人于2015年末提出了一种使用直接映射来连接不同网络层??的想法,并以此为基础提出了经典网络ResNet。ResNet网络核心在于深度残差??学习。对于一般的网络来说,单层通常可以看作y?=孖对于残差网络来说,??单层变成了?+?通过残差块,信息可以非常流畅地在高低层直接??传递。a:可以通过短路连接(shortcut?connection)来实现,如图1-3所示。短??路连接在ResNet中主要实现了恒等映射(identity?mapping),并在每一个残差块??中联结输入和输出。它的优势在于不增加额外的计算复杂度。通过残差连接,网??络层数可以达到惊人的152层。自此,卷积神经网络真正迈入深度时代。??受到ResNet思想的启发,Mao等人[2]于2016年提出了一种包含对称跳跃??连接的深度编解码网络RED来解决深度降噪摸型难以训练的问题。RED模型是??全卷积模型框架,即网络中不包含全连接层。图1-4为一个典型的10层RED模??型,包含5个卷积层(黄色方块)和5个反卷积层(橙色方块)。RED模型与之前??的方法相比,网络更深且去噪效果更好。该网络模型由大量
本文编号:3051138
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3051138.html
最近更新
教材专著