基于深度学习的图像复原技术研究
发布时间:2021-01-17 13:20
近年来,随着深度学习技术的出现,为图像复原领域提供了技术上的新方向,出现了众多基于深度学习技术的图像复原算法。已有研究主要关注图像复原中的图像去噪和图像超分辨重构两个领域。这两个领域本质上属于同一研究目标,即对图像丢失的信息进行重建。图像去噪主要针对高斯白噪声的去噪问题,已有的基于先验或者基于学习的方法,存在图像细节或边缘模糊,算法时耗高等问题。图像超分辨重构主要是对固定尺度的单张图像进行放大重构,已有的基于重构模型或者基于学习的方法,存在图像细节重构不完整,算法参数量大等问题。从深度学习技术的角度解决两个领域的问题,根本上是一致的,就是提取更有效的图像特征。在对两个方向进行了深入调研后,围绕两个领域中各自的研究热点和难点,分别进行了研究和改进。对于图像去噪领域,已有的卷积神经网络方法,存在收敛速度慢,测试速度慢,不能采用同一网络完成灰度图和彩色图去噪等问题。本文提出了一种基于多尺度特征的图像去噪算法,利用不同大小的卷积核提取不同尺度的特征,结合标准化的扩张卷积设计方法,加入残差学习,PReLU等常用的深度学习技术,训练了一个端到端的深度去噪网络。采用多个模型消融实验确定了网络结构。实...
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图像复原流程
重庆大学硕士学位论文2图像复原的相关理论与方法9图2.2神经元模型Figure.2.2Neuronmodel模型。左侧的0,1,2表示信息输入,可以扩展到多个。0,1,2表示各输入信息对应的权重。神经元模型中间的公式表示输入信息和权重的乘积累加。f则对应于激活函数。这里的激活函数是一个阈值控制,如公式2.11所示。公式里面的θ代表的是阈值,超过这个阈值则为0,相当于不激活该信号,低于这个阈值,则为1,相当于激活该信号。={0∑>()1∑≤()(2.11)卷积神经网络一般包括输入层、卷积层、池化层、激活函数层和全连接层[88],如图2.3所示。卷积神经网络区别于其他传统神经网络主要是因为稀疏连接和权重共享两个特点。稀疏连接带来的好处就是让模型有更好的表征力,并且不需要手动选择或设计特征,权重共享使得卷积神经网络能处理高维的数据,降低了网络的复杂性。这些特点使得卷积神经网络非常适合处理图像相关的任务。在图像复原的任务里面,本文也是采用的卷积神经网络来进行处理。2.3.1激活函数在前面提到的神经元模型中,如果没有激活函数f,那么剩余部分组成的就是一个线性模型。很显然,仅依靠线性模型难以解决现实生活中的绝大多数问题。而人脑的处理机制也并非一种线性关系。因此,引入激活函数的最初目的是为了增加模型的非线性,使得神经网络模型可以去逼近任意的非线性函数,增强模型的泛化能力。这里重点介绍几种在深度学习技术中常用的激活函数。第一种是sigmoid函数[53],如公式2.12所示。它来源于统计学,模型非常简
重庆大学硕士学位论文2图像复原的相关理论与方法10图2.3卷积神经网络模型示例图Figure.2.3Examplediagramofconvolutionalneuralnetworkmodel()=11+(2.12)单,并且在机器学习的很多模型中表现优异。Sigmoid在坐标轴上的图像曲线形似一个S曲线,值域在[0,1]之间。神经网络很长一段时间就是选用sigmoid作为激活函数,因为其有易求导、稳定等优点。不管在大小数据集上,只要经过较长时间的训练学习,都能取得不错的结果。但是也有不足的地方,由于函数的输出都是正值,导致权重更新的速度降低,并且在神经网络的反向传播过程中,远离原点坐标的值趋于稳定,易产生梯度消失的问题。第二种激活函数是双曲正切函数,其表达式如公式2.13所示。双曲正切函数()=sinhcosh=121+2(2.13)也是常用的激活函数之一,它的曲线图也是S型,值域在[1,1]之间,双曲函数更加适用于特征区分度很好的情况,在不断的迭代中能扩大这种区分度。对于特征之间相差不多或区别不明显时,sigmoid的效果会更好。由于双曲正切函数也是S曲线之一,在训练时同样会产生梯度弥漫的情况,不利于模型优化。第三种是现在常用的线性整流激活函数ReLU[54],表达式如公式2.14所示。它的提出主要是为了缓解sigmoid函数带来的梯度弥散问题。在实验中发现,经过ReLU处理的数据具有非常好的稀疏性,并且能降低计算量,加速模型训练,由于其函数表达式的特点,求出来的梯度是常数,有助于网络收敛。但是ReLU()=(0,)={0≤0>0(2.14)也有缺点,在曲线图里,左半部分均为0,导致在训练时会出现神经元“死亡”的现象。在实验中发现,当学习率很大时,极易出现神经元“死亡”现象。设置一个较小的学习率,能降低神经元的“死亡率”。第四种要介绍的激活函数是?
【参考文献】:
期刊论文
[1]基于改进K-SVD和非局部正则化的图像去噪[J]. 杨爱萍,田玉针,何宇清,董翠翠. 计算机工程. 2015(05)
[2]煤矿井下视频监控图像噪声消除算法的研究[J]. 孙永,贺广强,黄兴,张立刚. 科技信息. 2011(09)
[3]煤矿工业电视图像增强技术的应用研究[J]. Yuan XiaopingQian JianshengFu HuishengLiu Fuqiang (China University of Mining and Technology). 煤炭学报. 1999(02)
博士论文
[1]基于集成学习的人脸识别研究[D]. 李艳秋.合肥工业大学 2018
硕士论文
[1]基于深度学习的图像去噪算法研究[D]. 邓正林.电子科技大学 2018
[2]基于随机森林的单幅图像超分辨重建算法研究[D]. 卢欢.中国地质大学(北京) 2017
本文编号:2982964
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图像复原流程
重庆大学硕士学位论文2图像复原的相关理论与方法9图2.2神经元模型Figure.2.2Neuronmodel模型。左侧的0,1,2表示信息输入,可以扩展到多个。0,1,2表示各输入信息对应的权重。神经元模型中间的公式表示输入信息和权重的乘积累加。f则对应于激活函数。这里的激活函数是一个阈值控制,如公式2.11所示。公式里面的θ代表的是阈值,超过这个阈值则为0,相当于不激活该信号,低于这个阈值,则为1,相当于激活该信号。={0∑>()1∑≤()(2.11)卷积神经网络一般包括输入层、卷积层、池化层、激活函数层和全连接层[88],如图2.3所示。卷积神经网络区别于其他传统神经网络主要是因为稀疏连接和权重共享两个特点。稀疏连接带来的好处就是让模型有更好的表征力,并且不需要手动选择或设计特征,权重共享使得卷积神经网络能处理高维的数据,降低了网络的复杂性。这些特点使得卷积神经网络非常适合处理图像相关的任务。在图像复原的任务里面,本文也是采用的卷积神经网络来进行处理。2.3.1激活函数在前面提到的神经元模型中,如果没有激活函数f,那么剩余部分组成的就是一个线性模型。很显然,仅依靠线性模型难以解决现实生活中的绝大多数问题。而人脑的处理机制也并非一种线性关系。因此,引入激活函数的最初目的是为了增加模型的非线性,使得神经网络模型可以去逼近任意的非线性函数,增强模型的泛化能力。这里重点介绍几种在深度学习技术中常用的激活函数。第一种是sigmoid函数[53],如公式2.12所示。它来源于统计学,模型非常简
重庆大学硕士学位论文2图像复原的相关理论与方法10图2.3卷积神经网络模型示例图Figure.2.3Examplediagramofconvolutionalneuralnetworkmodel()=11+(2.12)单,并且在机器学习的很多模型中表现优异。Sigmoid在坐标轴上的图像曲线形似一个S曲线,值域在[0,1]之间。神经网络很长一段时间就是选用sigmoid作为激活函数,因为其有易求导、稳定等优点。不管在大小数据集上,只要经过较长时间的训练学习,都能取得不错的结果。但是也有不足的地方,由于函数的输出都是正值,导致权重更新的速度降低,并且在神经网络的反向传播过程中,远离原点坐标的值趋于稳定,易产生梯度消失的问题。第二种激活函数是双曲正切函数,其表达式如公式2.13所示。双曲正切函数()=sinhcosh=121+2(2.13)也是常用的激活函数之一,它的曲线图也是S型,值域在[1,1]之间,双曲函数更加适用于特征区分度很好的情况,在不断的迭代中能扩大这种区分度。对于特征之间相差不多或区别不明显时,sigmoid的效果会更好。由于双曲正切函数也是S曲线之一,在训练时同样会产生梯度弥漫的情况,不利于模型优化。第三种是现在常用的线性整流激活函数ReLU[54],表达式如公式2.14所示。它的提出主要是为了缓解sigmoid函数带来的梯度弥散问题。在实验中发现,经过ReLU处理的数据具有非常好的稀疏性,并且能降低计算量,加速模型训练,由于其函数表达式的特点,求出来的梯度是常数,有助于网络收敛。但是ReLU()=(0,)={0≤0>0(2.14)也有缺点,在曲线图里,左半部分均为0,导致在训练时会出现神经元“死亡”的现象。在实验中发现,当学习率很大时,极易出现神经元“死亡”现象。设置一个较小的学习率,能降低神经元的“死亡率”。第四种要介绍的激活函数是?
【参考文献】:
期刊论文
[1]基于改进K-SVD和非局部正则化的图像去噪[J]. 杨爱萍,田玉针,何宇清,董翠翠. 计算机工程. 2015(05)
[2]煤矿井下视频监控图像噪声消除算法的研究[J]. 孙永,贺广强,黄兴,张立刚. 科技信息. 2011(09)
[3]煤矿工业电视图像增强技术的应用研究[J]. Yuan XiaopingQian JianshengFu HuishengLiu Fuqiang (China University of Mining and Technology). 煤炭学报. 1999(02)
博士论文
[1]基于集成学习的人脸识别研究[D]. 李艳秋.合肥工业大学 2018
硕士论文
[1]基于深度学习的图像去噪算法研究[D]. 邓正林.电子科技大学 2018
[2]基于随机森林的单幅图像超分辨重建算法研究[D]. 卢欢.中国地质大学(北京) 2017
本文编号:2982964
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2982964.html
最近更新
教材专著