基于时序特征融合的视频目标检测方法
发布时间:2021-12-30 14:27
深度学习在静态图像中的研究已取得重大进展,其在视频目标检测领域中的研究才刚刚起步。随着视频数据的便捷获取和计算机算力的提升,视频目标检测作为视频理解的基础任务是计算机视觉领域亟待解决的问题之一。视频数据相对于静态图像具有数据量大,冗余性高,时序之间具有关联性等特点,且数据中存在遮挡、运动模糊、视频失焦和目标奇异姿态等独特挑战。现有方法一般从视频数据冗余性和时序关联性着手,通过冗余性加快视频检测的速度,或者通过时序关联性提高视频目标检测的精度。本文主要利用视频数据的时序相关性,通过时序特征融合提高难分图像的检测质量。同时,通过改进视频目标检测的网络结构,提高检测速度,以期实现速度与精度的平衡。针对上诉思想,本文主要做了以下三个工作:1.提出了一种基于Bi-ConvGRU(双向卷积门控循环神经单元)的视频目标检测方法。本方法将视频序列中各帧划分为当前帧和参考帧,当前帧采用特征提取网络得到对应当前帧特征,参考帧结合光流得到光流估计特征,通过Bi-ConvGRU学习当前帧和当前帧估计特征之间的联系,采用嵌入网络求解权重对Bi-ConvGRU结果进行加权融合。本方法,通过Bi-ConvGRU为当...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
简单智能监控系统
目标检测尺度问题
图 2. 1 训练集类别统计在实验中采用的训练集由图 2. 1 所示构成,其中主要数据集为 ImageNet VID 数据集中训练集每个视频片段隔 15 帧挑选一帧构成的 VID 训练集,采用间隔选帧的方
本文编号:3558385
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
简单智能监控系统
目标检测尺度问题
图 2. 1 训练集类别统计在实验中采用的训练集由图 2. 1 所示构成,其中主要数据集为 ImageNet VID 数据集中训练集每个视频片段隔 15 帧挑选一帧构成的 VID 训练集,采用间隔选帧的方
本文编号:3558385
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3558385.html