基于红外线成像视频的目标检测研究
发布时间:2020-08-06 12:05
【摘要】:目标检测是计算机视觉领域的一项具有挑战性的任务。不同于传统的RGB三通道视频拍摄设备,热红外(Thermal Infrared,TIR)像摄像仪具有能够在完全黑暗的环境中运行和对光照和阴影变化不敏感的优势。它能提供嘈杂的低分辨率图像,主要用于捕捉相对于较冷背景的目标。红外视频成像在军事和安全等领域的需求潜力巨大。相对于传统RGB三通道视频的研究,目前对红外视频目标检测的研究还相对较少,相关技术还亟待提高。论文的研究目标是针对根据热红外视频具有的噪声复杂、画质模糊、通道单一、图像信息少的特点,利用深度神经网络技术,提出了基于矫正光流算法红外视频目标检测模型,以及利用超分辨率模型来加强对小目标检测。本文的创新工作概括如下:1.针对红外视频光流噪声大和归一化时出现零点漂移的问题,在计算光流时,本文提出了非线性的矫正光流算法,使光流在作进一步归一化时,所有的静止目标可以保持相同的光流值,并且提出了高效的矫正阈值,使光流在矫正后能有效保持目标运动信息的区分度。2.对基于图像的单阶段目标检测系统进行了改进,通过在输入中叠加包含目标的运动信息的矫正光流图像和包含有外观信息的原始视频帧图像,提升了现有主要单阶段检测系统的性能,特别是同时提高了对外观信息缺乏的运动目标的检测性能。与传统运动目标检测模型不同,改进后的检测框架,还可以对静止目标进行有效地检测,克服了如帧间差分法等运动目标检测方法的不足,实现了动静目标的同时检测。3.针对红外视频图像包含外观信息少的特点,提出了利用基于深度神经网络的超分辨率模型,对视频图像信息进行了扩充和增强。实验结果表明,超分辨率化后的视频更有利于提高小目标的检测。4.针对原始VOT-TIR2016数据集的视频帧中只标注了一个目标的不足,本文对该数据集的标注进行了有效的扩充,使之能够适用于多目标检测,为进一步开展基于红外线视频的目标检测研究打下了良好的基础。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TN21
【图文】:
第一章 绪论第一章 绪 论1.1 课题研究背景和研究意义1.1.1 研究背景图像或视频目标检测一直是计算机视觉领域比较棘手的难题。深度学习的发展,为通用目标检测实现提供一个可靠的解决途径。通用目标检测主要涉及以下方面:(1)给定一幅图像,确定该图像中是否存在用户需求的目标。(2)确定目标所属的类别或标签。(3)确定目标所处图像中的具体位置,即目标的边界框(Bounding Box)的4 个顶点坐标。如图 1-1 所示。
目标检测所采用的热像仪器具有诸多优势:(1)能够在完全黑暗的环境中运(2)捕捉的画面对光照和阴影变化不敏感;(3)像医院所使用的 B 超类似捉对象的轮廓信息,减少了隐私侵入。从使用上看,热像仪能提供嘈杂的低率图像,主要用于捕捉相对于较冷背景的点状或较小的目标。早期因价格因通常仅限于军事目的。当前热像仪的价格趋于平民化,因此得到了广泛应用。怎样提高红外成像图像质量,扩展检测动态目标种类,成为当前急需解决的。虽然市场的需求潜力巨大,但目前涉及到热红外视频的目标检测的研究较少。于传统的 RGB 三通道图像,热红外图像相当于噪声复杂、画质模糊的灰度单图像,所采集的有用图像信息较少。影响热红外视频成像的主要因素是动力化和温度变化,而不是传统 RGB 三通道图像的照明变化和物体颜色变化。这温度变化是指目标的热特征变化。目标运动、雨水、灰尘、高湿度都会造成模糊[5]。部分成像效果和目标检测如图 1-2 所示。图 1-2(a)为红外线成像视人行走的序列图像,图 1-2(b)为红外线成像视频中发热汽车移动的序列图
一些传统的方法将背景模型设置为视频中前 N 帧的均值或中值,与均值模型或中值滤波模型相较,背景模型必须随着视频流方向自适应。高斯混合将红外图像中的每个像素构建为高斯混合,基于每个高斯方差,可以将图像特定像素分为背景和前景,该算法对于闪电变化、重复运动,杂乱运动和缓动具有鲁棒性。中值背景模型使用目标的长宽和阴影大小的比例来过滤掉非的区域,使用图像中背景的梯度信息剔除由于视差和配准误差导致的错误检用张量投票算法生成不同尺度的内在运动结构特征。.2.2 图像超分辨率研究现状图像超分辨(Super Resolution,SR)也属于计算机视觉重要的研究领域,像由较低的分辨率变换为较高的分辨率。它不是单纯的上采样过程,还要保像的细节和纹理清晰。单图像超分辨率(Single Image Super-Resolution ,SIS一个众所周知的挑战,具体的低分辨率(Low Resolution,LR)输入可以对应同的高分辨率(High Resolution,HR)图像空间[10]。基于神经网络的超分辨究具体发展历程如图 1-3 所示:
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TN21
【图文】:
第一章 绪论第一章 绪 论1.1 课题研究背景和研究意义1.1.1 研究背景图像或视频目标检测一直是计算机视觉领域比较棘手的难题。深度学习的发展,为通用目标检测实现提供一个可靠的解决途径。通用目标检测主要涉及以下方面:(1)给定一幅图像,确定该图像中是否存在用户需求的目标。(2)确定目标所属的类别或标签。(3)确定目标所处图像中的具体位置,即目标的边界框(Bounding Box)的4 个顶点坐标。如图 1-1 所示。
目标检测所采用的热像仪器具有诸多优势:(1)能够在完全黑暗的环境中运(2)捕捉的画面对光照和阴影变化不敏感;(3)像医院所使用的 B 超类似捉对象的轮廓信息,减少了隐私侵入。从使用上看,热像仪能提供嘈杂的低率图像,主要用于捕捉相对于较冷背景的点状或较小的目标。早期因价格因通常仅限于军事目的。当前热像仪的价格趋于平民化,因此得到了广泛应用。怎样提高红外成像图像质量,扩展检测动态目标种类,成为当前急需解决的。虽然市场的需求潜力巨大,但目前涉及到热红外视频的目标检测的研究较少。于传统的 RGB 三通道图像,热红外图像相当于噪声复杂、画质模糊的灰度单图像,所采集的有用图像信息较少。影响热红外视频成像的主要因素是动力化和温度变化,而不是传统 RGB 三通道图像的照明变化和物体颜色变化。这温度变化是指目标的热特征变化。目标运动、雨水、灰尘、高湿度都会造成模糊[5]。部分成像效果和目标检测如图 1-2 所示。图 1-2(a)为红外线成像视人行走的序列图像,图 1-2(b)为红外线成像视频中发热汽车移动的序列图
一些传统的方法将背景模型设置为视频中前 N 帧的均值或中值,与均值模型或中值滤波模型相较,背景模型必须随着视频流方向自适应。高斯混合将红外图像中的每个像素构建为高斯混合,基于每个高斯方差,可以将图像特定像素分为背景和前景,该算法对于闪电变化、重复运动,杂乱运动和缓动具有鲁棒性。中值背景模型使用目标的长宽和阴影大小的比例来过滤掉非的区域,使用图像中背景的梯度信息剔除由于视差和配准误差导致的错误检用张量投票算法生成不同尺度的内在运动结构特征。.2.2 图像超分辨率研究现状图像超分辨(Super Resolution,SR)也属于计算机视觉重要的研究领域,像由较低的分辨率变换为较高的分辨率。它不是单纯的上采样过程,还要保像的细节和纹理清晰。单图像超分辨率(Single Image Super-Resolution ,SIS一个众所周知的挑战,具体的低分辨率(Low Resolution,LR)输入可以对应同的高分辨率(High Resolution,HR)图像空间[10]。基于神经网络的超分辨究具体发展历程如图 1-3 所示:
【相似文献】
相关期刊论文 前10条
1 柴桦;;基于深度卷积网络的压缩人脸超分辨率研究[J];信息与电脑(理论版);2019年18期
2 朱海;王国中;范涛;杨露;;基于深度超分辨率重建的监控图像人脸识别[J];电子测量技术;2018年16期
3 付龙;吕晓琪;李婷;谷宇;;基于扩散的自适应超分辨率重建[J];现代电子技术;2017年10期
4 刘芳华;阮若林;王建峰;倪浩;;基于在线字典学习的人脸超分辨率重建[J];现代电子技术;2017年13期
5 卫小强;;基于仿生学多源图像超分辨率重建的并行优化研究[J];电脑编程技巧与维护;2017年13期
6 廖海斌;陈友斌;陈庆虎;;基于非局部相似字典学习的人脸超分辨率与识别[J];武汉大学学报(信息科学版);2016年10期
7 王宇辉;;图像超分辨率重新建立技术综述[J];科技创业月刊;2016年17期
8 贾志城;;视频超分辨率重建及其刑侦应用[J];中国有线电视;2015年08期
9 赵U
本文编号:2782373
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2782373.html