基于CNN的场景图像分类与弱光图像增强研究

发布时间：2020-09-16 19:33

　　图像中含有大量的信息,是人类感知世界直接且高效的信息来源,是人类表达信息的重要载体和传递信息的重要媒介。随着硬件设备以及计算机网络技术的迅速发展,数字图像数量呈现指数式的增长,使用计算机处理大量的数字图像完成相关计算机视觉任务成为必行的趋势。在众多计算机视觉任务解决方法和工具中,卷积神经网络(CNN,Convolutional Neural Network)作为优良的图像特征提取器,已经广泛运用到图像分类、目标识别等领域,并取得了很好的效果。但由于CNN需要大量的图像来支持训练,其收敛速度、过拟合现象的存在都限制了其性能的发挥,在某些特定场景下以及具体应用中,仍需要对CNN结构进行优化以取得更好的效果。本文在对现有文献的研究基础下,对基于卷积神经网络的场景图像分类以及低照度图像增强两个问题进行研究。主要研究内容包括:(1)针对现有基于卷积神经网络的场景识别算法无法处理目标场景图像是多光谱图像的问题,本文提出一种基于多路卷积神经网络的多光谱场景识别方法。利用改进的CNN结构综合多个光谱上的信息,结合预训练方法,有效提升了场景的分类精度。(2)针对一般CNN使用池化层对特征进行降维操作,造成信息损失,影响网络表达能力的问题,提出参数池化层(Parameterized Pooling Layer)替代一般CNN中的池化层。参数池化层在仅仅增加了少量网络参数的情况下,最大可能的保留了卷积神经网络中希望被保留下来的特征,提高了网络性能。同时,由于增加了池化层前向传播的信息,从而影响了反向传播算法中权值的更新,网络更加易于收敛且收敛速度更快。(3)提出一种基于去光照影响的低照度图像增强方法,利用卷积神经网络从低照度图像训练集中学习Retinex理论中需要估计的参数,实现端到端的低照度图像增强。通过模拟数据实验以及真实低照度图像增强实验证明,本文提出的DIENet(De-illumination Effect Net)网络模型有效地提高了图像整体亮度和对比度,较一些经典算法以及其他基于CNN的方法在结构相似度和峰值信噪比上均有所提高。
【学位单位】：桂林电子科技大学
【学位级别】：硕士
【学位年份】：2019
【中图分类】：TP391.41;TP183
【部分图文】：

基本结构,卷积

逑池化层生要用于给数据降维以减少计算；量＊并不是所有的ＣＮＮ模型中都带有池化层Ｂ逡逑—般ＣＮＮ的结构如图２－１所示。下面，对各层进行具体讲述。逡逑ｆｅａｔｕｒｅ逦Ｆｅａｔｕｒｅ逦Ｆｅａｔｕｒｅ逦Ｆｅａｔｕｒｅ逦Ｆｅａｔｕｒｅｓ逡逑Ｈａｐｓ逦Ｈａｐｓ逦Ｍａｐｓ逦Ｍａｐｓ逡逑卷积层１逦池化层逦卷和层２邋１——Ｉ池化层一全连接层：逡逑图２－１邋ＣＮＮ的基本结构逡逑１邋？卷积层逡逑卷积层是实现ＣＮＮ特征提取功能的核心结构，拍如其名宇＞邋该层对于输入的图逡逑像做卷积运算。此处卷积运算的数学原理与圈像的滤波是一致的，它们都需要使用一逡逑个称为滤波核＿＿〔在ＣＮＮ中称为卷积核）的矩阵与掘像．一个卷积．区域逐元素．相乘后求逡逑和，由此得到卷积启图像的一个像素值。接下来使用滑动窗口的形式遍历整个图像即逡逑可得到卷积后的图像。ＣＮＮ中卷积层与图像滤波的不同之处在于，图像滤波运算的逡逑滤波核是人工设计好的固定样式的滤波核，例如高斯滤波、中值滤波等；而ＣＮＮ中逡逑的卷积运算中的卷积核使用随机初始化赋值并在网络模型的训练过程中由反向传播逡逑（ＢＰ）算法进行调整。ＣＮＮ中的卷积操作还需加上一个偏置项得到最后的输出，其逡逑具体操作如下式。逡逑４邋＝逦（２－１）逡逑ｉ＆Ｍｊ逡逑其中，ｚ；表示第／层卷积层的第ｊ个未激活输出，ｘ丨表示第（层的输入，也就是逡逑前一层的输出（在本文公式中

示意图,示意图,卷积运算,卷积

逦－￣￣＜逐元素相乘逦？邋５邋－４邋０邋ｒ＜求和〉逡逑Ｔ｜邋０邋Ｉ邋６逡逑图邋２．－２．邋ＣＮＮ邋中：卷积运算an理，ｋｓｉｚｅ＝３，ｓｔｒｉｄｅ＝ｌ，邋ｐａｄｄｉｎｇ＝０逡逑在图２－２所示的卷积运算下，被卷积的图像边缘像素并不会作为卷积运算的中心，逡逑＿此卷积之后的图像大小会发生改变。在实际ＣＮＮ的卷积运算中，卷积运算具有三逡逑个超参数，它们影响卷积操作之后图像的大小。卷积核大小（ｋｓｉｚｅ）指的是参与卷积逡逑运算的权桯的长和宽；步长（ｓｔｒｉｄｅ）指的是滑窗的步幅；填充（ｐａｄｄｉｎｇ）指的是在图逡逑像的边缘以外填充一些像素，保证图像的边缘像素也能够成为卷积运算的中心。三者逡逑与被卷积图像、卷积后图像的大小关系如下式。逡逑Ｈ邋Ｈ－ｋｓｉｚｅ邋＋邋ｐａｄｄｉｎｇ邋｜邋１逦⑴）逡逑ｓｔｒｉｄｅ逡逑Ｈ表示输入数据的长度或者宽度，丑’表亦输出数据的长度或者宽度。由式（２－２〉逡逑可知，在图像边缘没有填充（ｐａｄｄｉｎｇ＝０）的情况下，卷积的步长越大，得到的特征图逡逑大小就会成倍缩小，在实际应用中往往通过设置较大的步长实现特征图的降维。逡逑２■激活层逡逑从式（２－１）可知，卷积运算得到的结果实际上是一个线性组合的计算过程。为使逡逑模型更加具有季线性的表达能力

过程图,方法,过程,降采样

３．池化层误差反向传播逡逑假设＜５；为第／层的误差冱该层＿输出层，其下一层是池化层，并且已知该池化层逡逑的误差。按照（２－１０）式的思想，有：逡逑ｄＣ邋ｄｚ！＋１逡逑袁逦（２＇１９）逡逑其屮，ｚ【＋１邋＝邋ｄｏｗｎｓａｍｐＺｅｉＸｚ〗）），根据池化方法的不＿选用的降采样方法也不逡逑一样。池化层没有需要学习的参数，但是降采样函数造成了数据维度上的变化，因此逡逑需要一个上采样的过程使本层误差数据表示的维度恢复到采样前，上采样方法与池化逡逑方法有关。式（２－１９）写为：逡逑８ｌｋ邋＝邋ｕｐｓａｍｐｌｅ邋（＾＋１）邋0邋ｃｒ＇邋（邋４邋）逦（．２－２０）逡逑ＭｐｓａｍＰＺｅ（＿）函数根据不同的池化方法进行不同的操作。若采用最大池化方法，逡逑则上采样函数将误差矩阵衫＋１以０填充的方法恢复到采样前的大小，然后将５（＋１中的逡逑值放回其采样位置中；若采用平均池化，同样先将衫＋１恢复到采样前的大小，然后将逡逑被＋１每个值平均到对应的池化域中。上采样函数的操作示意图如图２－４所示。逡逑

【参考文献】