卷积神经网络在电力设备红外图像识别中的应用研究
发布时间:2020-08-27 07:34
【摘要】:电力设备红外图像识别是实现红外成像下电力设备状态监测和故障诊断的必要前提。在实际场景中,由于红外图像的成像特点、背景环境的复杂性以及电力设备自身的多样性和差异性,电力设备红外图像识别存在较大难度,基于人工特征的传统图像识别方法难以满足实际场景中电力设备红外图像识别的要求。而近年来兴起的以卷积神经网络为代表的深度学习技术由于能对输入进行由浅到深多层次的特征表征和端到端的学习,在图像识别的性能上显著优于传统方法。因此,本文对卷积神经网络在电力设备红外图像识别中的应用进行研究。考虑到实际场景中的电力设备红外图像识别是一个目标检测任务,先分析了将基于卷积神经网络的目标检测算法应用到电力设备红外图像识别面临的难点。然后针对难点,以基于特征金字塔网络(Feature Pyramid Network,FPN)的Faster R-CNN模型(本文简称为FP-FRCNN)为研究基础,通过分析FP-FRCNN存在的不足,对FP-FRCNN进行改进,最终所提出的基于改进FP-FRCNN模型的电力设备红外图像识别算法实现了电力设备红外图像高精度且较快速的识别。本文主要工作内容如下:(1)基于FP-FRCNN模型的电力设备红外图像识别算法研究。为了解决电力设备红外图像识别存在小尺寸设备较难识别以及视觉特征较难提取的问题,本文以对小目标具有较强识别能力的FP-FRCNN模型为研究基础,通过分析原始的FP-FRCNN模型存在的不足,对其进行改进:从增强模型特征提取能力角度出发,在模型的卷积主干网络部分使用密集连接结构并引入压缩激励结构;还从提升模型目标定位精度角度出发,使用Ro IAlign池化代替原来的Ro I Pooling池化。在自建的电力设备红外图像数据集上的实验结果表明,改进的FP-FRCNN模型能达到90.4%的m AP(mean Average Precision),相比原始FP-FRCNN模型提升5.7个百分点,且在GPU上能达到15帧/秒的识别速度。(2)电力设备红外图像识别系统的设计与实现。为将本文的研究成果直接应用于实际,本文还设计了一个电力设备红外图像识别系统。其由本地识别主系统和远程识别子系统两部分组成,可对保存于本地的或通过网络传输过来的电力设备红外图像进行精准识别,并将识别结果可视化,同时显示识别时间、目标数量等相关信息,具有一定的实用价值。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TM50;TP391.41;TP183
【图文】:
(1)电力设备红外图像的视觉特征较难提取:红外图像是反映物体表面温度分布状的伪彩色图像,具有整体灰度分布低且集中、信噪比低、对比度低等特点[21]。如图所示,与可见光图像相比,红外图像的整体质量较低、缺少图像细节信息。而基于卷神经网络的目标检测算法是直接利用图像数据来学习图像的特征表示,图像质量的不和细节信息的缺乏会增加 CNN 提取视觉特征的难度。(2)小尺寸设备较难识别:电力设备红外图像中有很多电力设备的尺寸都比较小,比图 1-1a)中的绝缘子、刀闸、避雷器等。而对于基于卷积神经网络的目标检测算法,由CNN 在逐层提取图像特征得到语义信息的过程中,特征图的分辨率会不断降低,物体尺寸不同会导致相应的语义信息出现在卷积神经网络的不同层。小尺寸物体相应的语信息会出现在更靠前的网络层,而到了更靠后的网络层其语义信息则会消失[22],从而致网络最后的分类层难以对小尺寸物体进行分类判断,另外小尺寸物体对识别的定位度也有更高的要求,这些因素都使得小尺寸设备较难识别。
CNN 中一个二维卷积操作的示例[35](滑动步长经网络中执行池化操作的层,也叫下采样层。池化函数将特征图的响应值汇合起来,从而达。在卷积神经网络的结构中,通常是在几个连来对卷积层提取的特征表示进行降维和抽象。化函数。其中平均池化函数给出输入的相邻矩的背景信息。而最大池化函数则给出输入的相数,能保留更多的纹理信息。因为池化是在空所以不会改变数据体的深度,也不会引入需要图的空间尺寸,从而减少网络的参数和计算量全连接层与多层前馈神经网络的结构是一致有输出数据全部连接。全连接层实现的功能是
图 2-3 LeNet-5 卷积神经网络的结构图[7]2.2.3 卷积神经网络的学习训练卷积神经网络的学习训练,就是根据训练数据不断调整网络中可学习的参数。在卷积神经网络的学习训练中,有两个基本过程:前向传播(forwardpropagation)和反向传播(backwardpropagation)[36],卷积神经网络的学习训练正是通过前向传播和反向传播过程交替迭代执行直到网络模型收敛来实现的。前向传播过程中,输入样本 提供初始信息,然后传播到每一层的神经元,信息通过网络向前流动,最终产生预测输出 ,并通过损失函数(loss function,也称目标函数或代价函数)来量化网络预测输出 与输入样本对应的真实标签y之间的吻合度。损失函数通常由基本的损失函数再加上一个用于控制网络模型复杂度的正则项组成如式(2-1)所示:
本文编号:2805814
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TM50;TP391.41;TP183
【图文】:
(1)电力设备红外图像的视觉特征较难提取:红外图像是反映物体表面温度分布状的伪彩色图像,具有整体灰度分布低且集中、信噪比低、对比度低等特点[21]。如图所示,与可见光图像相比,红外图像的整体质量较低、缺少图像细节信息。而基于卷神经网络的目标检测算法是直接利用图像数据来学习图像的特征表示,图像质量的不和细节信息的缺乏会增加 CNN 提取视觉特征的难度。(2)小尺寸设备较难识别:电力设备红外图像中有很多电力设备的尺寸都比较小,比图 1-1a)中的绝缘子、刀闸、避雷器等。而对于基于卷积神经网络的目标检测算法,由CNN 在逐层提取图像特征得到语义信息的过程中,特征图的分辨率会不断降低,物体尺寸不同会导致相应的语义信息出现在卷积神经网络的不同层。小尺寸物体相应的语信息会出现在更靠前的网络层,而到了更靠后的网络层其语义信息则会消失[22],从而致网络最后的分类层难以对小尺寸物体进行分类判断,另外小尺寸物体对识别的定位度也有更高的要求,这些因素都使得小尺寸设备较难识别。
CNN 中一个二维卷积操作的示例[35](滑动步长经网络中执行池化操作的层,也叫下采样层。池化函数将特征图的响应值汇合起来,从而达。在卷积神经网络的结构中,通常是在几个连来对卷积层提取的特征表示进行降维和抽象。化函数。其中平均池化函数给出输入的相邻矩的背景信息。而最大池化函数则给出输入的相数,能保留更多的纹理信息。因为池化是在空所以不会改变数据体的深度,也不会引入需要图的空间尺寸,从而减少网络的参数和计算量全连接层与多层前馈神经网络的结构是一致有输出数据全部连接。全连接层实现的功能是
图 2-3 LeNet-5 卷积神经网络的结构图[7]2.2.3 卷积神经网络的学习训练卷积神经网络的学习训练,就是根据训练数据不断调整网络中可学习的参数。在卷积神经网络的学习训练中,有两个基本过程:前向传播(forwardpropagation)和反向传播(backwardpropagation)[36],卷积神经网络的学习训练正是通过前向传播和反向传播过程交替迭代执行直到网络模型收敛来实现的。前向传播过程中,输入样本 提供初始信息,然后传播到每一层的神经元,信息通过网络向前流动,最终产生预测输出 ,并通过损失函数(loss function,也称目标函数或代价函数)来量化网络预测输出 与输入样本对应的真实标签y之间的吻合度。损失函数通常由基本的损失函数再加上一个用于控制网络模型复杂度的正则项组成如式(2-1)所示:
【参考文献】
相关期刊论文 前1条
1 陈俊佑;金立军;段绍辉;姚森敬;赵灵;;基于Hu不变矩的红外图像电力设备识别[J];机电工程;2013年01期
相关硕士学位论文 前1条
1 张明;基于红外图像的变电设备分类及在故障诊断中的应用[D];合肥工业大学;2012年
本文编号:2805814
本文链接:https://www.wllwen.com/kejilunwen/dianlilw/2805814.html
教材专著