基于CNN的场景图像分类与弱光图像增强研究
发布时间:2020-09-16 19:33
图像中含有大量的信息,是人类感知世界直接且高效的信息来源,是人类表达信息的重要载体和传递信息的重要媒介。随着硬件设备以及计算机网络技术的迅速发展,数字图像数量呈现指数式的增长,使用计算机处理大量的数字图像完成相关计算机视觉任务成为必行的趋势。在众多计算机视觉任务解决方法和工具中,卷积神经网络(CNN,Convolutional Neural Network)作为优良的图像特征提取器,已经广泛运用到图像分类、目标识别等领域,并取得了很好的效果。但由于CNN需要大量的图像来支持训练,其收敛速度、过拟合现象的存在都限制了其性能的发挥,在某些特定场景下以及具体应用中,仍需要对CNN结构进行优化以取得更好的效果。本文在对现有文献的研究基础下,对基于卷积神经网络的场景图像分类以及低照度图像增强两个问题进行研究。主要研究内容包括:(1)针对现有基于卷积神经网络的场景识别算法无法处理目标场景图像是多光谱图像的问题,本文提出一种基于多路卷积神经网络的多光谱场景识别方法。利用改进的CNN结构综合多个光谱上的信息,结合预训练方法,有效提升了场景的分类精度。(2)针对一般CNN使用池化层对特征进行降维操作,造成信息损失,影响网络表达能力的问题,提出参数池化层(Parameterized Pooling Layer)替代一般CNN中的池化层。参数池化层在仅仅增加了少量网络参数的情况下,最大可能的保留了卷积神经网络中希望被保留下来的特征,提高了网络性能。同时,由于增加了池化层前向传播的信息,从而影响了反向传播算法中权值的更新,网络更加易于收敛且收敛速度更快。(3)提出一种基于去光照影响的低照度图像增强方法,利用卷积神经网络从低照度图像训练集中学习Retinex理论中需要估计的参数,实现端到端的低照度图像增强。通过模拟数据实验以及真实低照度图像增强实验证明,本文提出的DIENet(De-illumination Effect Net)网络模型有效地提高了图像整体亮度和对比度,较一些经典算法以及其他基于CNN的方法在结构相似度和峰值信噪比上均有所提高。
【学位单位】:桂林电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.41;TP183
【部分图文】:
逑池化层生要用于给数据降维以减少计算;量*并不是所有的CNN模型中都带有池化层B逡逑—般CNN的结构如图2-1所示。下面,对各层进行具体讲述。逡逑feature逦Feature逦Feature逦Feature逦Features逡逑Haps逦Haps逦Maps逦Maps逡逑卷积层1逦池化层逦卷和层2邋1——I池化层一全连接层:逡逑图2-1邋CNN的基本结构逡逑1邋?卷积层逡逑卷积层是实现CNN特征提取功能的核心结构,拍如其名宇>邋该层对于输入的图逡逑像做卷积运算。此处卷积运算的数学原理与圈像的滤波是一致的,它们都需要使用一逡逑个称为滤波核__〔在CNN中称为卷积核)的矩阵与掘像.一个卷积.区域逐元素.相乘后求逡逑和,由此得到卷积启图像的一个像素值。接下来使用滑动窗口的形式遍历整个图像即逡逑可得到卷积后的图像。CNN中卷积层与图像滤波的不同之处在于,图像滤波运算的逡逑滤波核是人工设计好的固定样式的滤波核,例如高斯滤波、中值滤波等;而CNN中逡逑的卷积运算中的卷积核使用随机初始化赋值并在网络模型的训练过程中由反向传播逡逑(BP)算法进行调整。CNN中的卷积操作还需加上一个偏置项得到最后的输出,其逡逑具体操作如下式。逡逑4邋=逦(2-1)逡逑i&Mj逡逑其中,z;表示第/层卷积层的第j个未激活输出,x丨表示第(层的输入,也就是逡逑前一层的输出(在本文公式中
逦- ̄ ̄<逐元素相乘逦?邋5邋-4邋0邋r<求和〉逡逑T|邋0邋I邋6逡逑图邋2.-2.邋CNN邋中:卷积运算an理,ksize=3,stride=l,邋padding=0逡逑在图2-2所示的卷积运算下,被卷积的图像边缘像素并不会作为卷积运算的中心,逡逑_此卷积之后的图像大小会发生改变。在实际CNN的卷积运算中,卷积运算具有三逡逑个超参数,它们影响卷积操作之后图像的大小。卷积核大小(ksize)指的是参与卷积逡逑运算的权桯的长和宽;步长(stride)指的是滑窗的步幅;填充(padding)指的是在图逡逑像的边缘以外填充一些像素,保证图像的边缘像素也能够成为卷积运算的中心。三者逡逑与被卷积图像、卷积后图像的大小关系如下式。逡逑H邋H-ksize邋+邋padding邋|邋1逦⑴)逡逑stride逡逑H表示输入数据的长度或者宽度,丑’表亦输出数据的长度或者宽度。由式(2-2〉逡逑可知,在图像边缘没有填充(padding=0)的情况下,卷积的步长越大,得到的特征图逡逑大小就会成倍缩小,在实际应用中往往通过设置较大的步长实现特征图的降维。逡逑2■激活层逡逑从式(2-1)可知,卷积运算得到的结果实际上是一个线性组合的计算过程。为使逡逑模型更加具有季线性的表达能力
3.池化层误差反向传播逡逑假设<5;为第/层的误差冱该层_输出层,其下一层是池化层,并且已知该池化层逡逑的误差。按照(2-10)式的思想,有:逡逑dC邋dz!+1逡逑袁逦(2'19)逡逑其屮,z【+1邋=邋downsampZeiXz〗)),根据池化方法的不_选用的降采样方法也不逡逑一样。池化层没有需要学习的参数,但是降采样函数造成了数据维度上的变化,因此逡逑需要一个上采样的过程使本层误差数据表示的维度恢复到采样前,上采样方法与池化逡逑方法有关。式(2-19)写为:逡逑8lk邋=邋upsample邋(^+1)邋0邋cr'邋(邋4邋)逦(.2-20)逡逑MpsamPZe(_)函数根据不同的池化方法进行不同的操作。若采用最大池化方法,逡逑则上采样函数将误差矩阵衫+1以0填充的方法恢复到采样前的大小,然后将5(+1中的逡逑值放回其采样位置中;若采用平均池化,同样先将衫+1恢复到采样前的大小,然后将逡逑被+1每个值平均到对应的池化域中。上采样函数的操作示意图如图2-4所示。逡逑
本文编号:2820281
【学位单位】:桂林电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.41;TP183
【部分图文】:
逑池化层生要用于给数据降维以减少计算;量*并不是所有的CNN模型中都带有池化层B逡逑—般CNN的结构如图2-1所示。下面,对各层进行具体讲述。逡逑feature逦Feature逦Feature逦Feature逦Features逡逑Haps逦Haps逦Maps逦Maps逡逑卷积层1逦池化层逦卷和层2邋1——I池化层一全连接层:逡逑图2-1邋CNN的基本结构逡逑1邋?卷积层逡逑卷积层是实现CNN特征提取功能的核心结构,拍如其名宇>邋该层对于输入的图逡逑像做卷积运算。此处卷积运算的数学原理与圈像的滤波是一致的,它们都需要使用一逡逑个称为滤波核__〔在CNN中称为卷积核)的矩阵与掘像.一个卷积.区域逐元素.相乘后求逡逑和,由此得到卷积启图像的一个像素值。接下来使用滑动窗口的形式遍历整个图像即逡逑可得到卷积后的图像。CNN中卷积层与图像滤波的不同之处在于,图像滤波运算的逡逑滤波核是人工设计好的固定样式的滤波核,例如高斯滤波、中值滤波等;而CNN中逡逑的卷积运算中的卷积核使用随机初始化赋值并在网络模型的训练过程中由反向传播逡逑(BP)算法进行调整。CNN中的卷积操作还需加上一个偏置项得到最后的输出,其逡逑具体操作如下式。逡逑4邋=逦(2-1)逡逑i&Mj逡逑其中,z;表示第/层卷积层的第j个未激活输出,x丨表示第(层的输入,也就是逡逑前一层的输出(在本文公式中
逦- ̄ ̄<逐元素相乘逦?邋5邋-4邋0邋r<求和〉逡逑T|邋0邋I邋6逡逑图邋2.-2.邋CNN邋中:卷积运算an理,ksize=3,stride=l,邋padding=0逡逑在图2-2所示的卷积运算下,被卷积的图像边缘像素并不会作为卷积运算的中心,逡逑_此卷积之后的图像大小会发生改变。在实际CNN的卷积运算中,卷积运算具有三逡逑个超参数,它们影响卷积操作之后图像的大小。卷积核大小(ksize)指的是参与卷积逡逑运算的权桯的长和宽;步长(stride)指的是滑窗的步幅;填充(padding)指的是在图逡逑像的边缘以外填充一些像素,保证图像的边缘像素也能够成为卷积运算的中心。三者逡逑与被卷积图像、卷积后图像的大小关系如下式。逡逑H邋H-ksize邋+邋padding邋|邋1逦⑴)逡逑stride逡逑H表示输入数据的长度或者宽度,丑’表亦输出数据的长度或者宽度。由式(2-2〉逡逑可知,在图像边缘没有填充(padding=0)的情况下,卷积的步长越大,得到的特征图逡逑大小就会成倍缩小,在实际应用中往往通过设置较大的步长实现特征图的降维。逡逑2■激活层逡逑从式(2-1)可知,卷积运算得到的结果实际上是一个线性组合的计算过程。为使逡逑模型更加具有季线性的表达能力
3.池化层误差反向传播逡逑假设<5;为第/层的误差冱该层_输出层,其下一层是池化层,并且已知该池化层逡逑的误差。按照(2-10)式的思想,有:逡逑dC邋dz!+1逡逑袁逦(2'19)逡逑其屮,z【+1邋=邋downsampZeiXz〗)),根据池化方法的不_选用的降采样方法也不逡逑一样。池化层没有需要学习的参数,但是降采样函数造成了数据维度上的变化,因此逡逑需要一个上采样的过程使本层误差数据表示的维度恢复到采样前,上采样方法与池化逡逑方法有关。式(2-19)写为:逡逑8lk邋=邋upsample邋(^+1)邋0邋cr'邋(邋4邋)逦(.2-20)逡逑MpsamPZe(_)函数根据不同的池化方法进行不同的操作。若采用最大池化方法,逡逑则上采样函数将误差矩阵衫+1以0填充的方法恢复到采样前的大小,然后将5(+1中的逡逑值放回其采样位置中;若采用平均池化,同样先将衫+1恢复到采样前的大小,然后将逡逑被+1每个值平均到对应的池化域中。上采样函数的操作示意图如图2-4所示。逡逑
【参考文献】
相关期刊论文 前4条
1 张瑞杰;李弼程;魏福山;;基于多尺度上下文语义信息的图像场景分类算法[J];电子学报;2014年04期
2 杨昭;高隽;谢昭;吴克伟;;局部Gist特征匹配核的场景分类[J];中国图象图形学报;2013年03期
3 曹莹;苗启广;刘家辰;高琳;;AdaBoost算法研究进展与展望[J];自动化学报;2013年06期
4 殷慧;曹永锋;孙洪;;基于多维金字塔表达和AdaBoost的高分辨率SAR图像城区场景分类算法[J];自动化学报;2010年08期
相关硕士学位论文 前1条
1 李琰婷;基于偏微分方程的可见光图像增强方法及实现[D];长春理工大学;2014年
本文编号:2820281
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2820281.html