基于循环神经网络的目标检测与跟踪系统研究与实现
发布时间:2020-08-26 06:53
【摘要】:目标跟踪无论是从研究方面还是实际应用方面都有很高的价值,因此目标跟踪成为了计算机视觉的重要研究领域之一,同时在民用和军事上都有广泛的应用。利用跟踪系统的智能化,能够有效降低相关工作人员的工作强度,提高效率。随着人工智能技术的飞速发展,目标跟踪技术日渐成熟,但是真实场景中的目标跟踪仍面临着各种非约束条件,如被跟踪目标物体的外观变化、平面内外旋转、尺度变化、背景空间的光照变化、以及背景物体与目标物体的遮挡等因素的影响。这些非约束条件的变化会影响到目标跟踪算法的性能,无法实现目标跟踪在实际生活中的应用。视频序列的检测与跟踪是一个典型的时序任务,前后帧的时序信息能够帮助提升跟踪算法的性能,基于此,本文针对复杂场景中的目标检测与跟踪问题进行了相关研究,引入视频帧的帧间信息,将循环神经网络应用于目标跟踪任务,设计实现了一个基于循环神经网络的目标检测与跟踪系统。本文提出了一种基于循环神经网络的目标检测与跟踪算法,并在其基础上做了改进,实现了部分遮挡场景下的性能提升。同时设计并实现了一套基于本文提出算法的可交互的目标检测与跟踪系统。下面我们将对本文的主要研究内容及创新点进行简要介绍。1.为了有效地缩小候选区域的搜索范围,同时减少目标跟踪性能对目标检测性能的依赖性,提出了基于长短期记忆网络(Long Short-Term Memory,LSTM)的方向预测模型,用来确定物体运动状态,帮助用于目标检测的感兴趣区域的确定。通过实验验证,相比于其他的跟踪算法,本文的跟踪算法对帧间的时序信息利用的比较充分,使得本文提出的算法无论是精度还是速度都有一定的优势。同时,本文提出的基于运动方向预测的目标检测与跟踪算法对于目标尺度发生剧烈变化的场景更加鲁棒。2.为了进一步减少对目标检测性能的依赖性以及加快跟踪算法的速度,在基于循环神经网络的目标检测与跟踪算法的基础上,提出了一种自适应的检测机制,通过将相关滤波与深度学习结合,实现了不逐帧检测。实验结果表明,使用相关滤波思想的方法对提升跟踪性能、减小对目标检测的依赖以及提升跟踪速度有所帮助。同时,本文提出的基于自适应检测的目标跟踪算法对于目标被部分遮挡的场景更加鲁棒。3.基于本文提出的基于循环神经网络的目标检测与跟踪算法,设计并实现了一套可交互的目标检测与跟踪系统。验证了本文提出的目标检测与跟踪算法可以应用到实际的复杂场效中,木文设计和实现的交互系统具有一定的实用价值,因此本文研究的内容具有广泛的研究意义和应用价值。综上,使用OTB以及VOT数据集对本文提出的基于运动方向预测的目标检测与跟踪算法及基于自适应检测的目标跟踪算法进行测试,在两个数据集上均取得了较好的评测效果。另外,对本文设计的可交互的目标检测与跟踪系统进行测试,证明了本文设计并实现的交互系统具有一定的应用价值。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【图文】:
边界框回归是一种对预测得到的目标候选框进行纠正的线性回归算法。由于逡逑检测得到的目标边界框与真值框差别较大,即使分类器识别正确,还是会导致最逡逑后的检测结果失败,如图2-1所示。其中红色的框表示真值框,绿色的框表示预逡逑测得到的边界框,即便绿色的框被正确识别为汽车,但是由于绿色框与红色框的逡逑IOU小于阈值,一般为0.5,还是认为没有正确的检测出汽车。因此,我们需要逡逑对预测框进行微调,经过微调后的预测框与真值框更加接近,使得预测框的定位逡逑更加准确。逡逑、一逡逑B逦^逡逑....邋'邋.逡逑匕:逡逑图2-丨预测边界框与真值框对比示意图逡逑对于一个边界框一般使用四维向量(x,y,w,邋h)表示,分别代表边界框逡逑的中心点坐标以及长和宽。通过边界框回归得到的映射结果如图2-2所示,红色逡逑框表示目标的真值框G,绿色框表示检测得到的边界框P。边界框回归的目标是逡逑寻找一种关系使得输入检测得到的边界框P经过映射得到一个更接近于真值框逡逑9逡逑
通过平移和尺度缩放可以实现上述的映射关系。首先对边界框的中心点坐标逡逑做平移,然后再对边界框的宽和高做尺度缩放。边界框回归就是学习四个偏移量,逡逑那么目标函数可以表示为[|义希蓿ǎ穑剑停唬
本文编号:2804859
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【图文】:
边界框回归是一种对预测得到的目标候选框进行纠正的线性回归算法。由于逡逑检测得到的目标边界框与真值框差别较大,即使分类器识别正确,还是会导致最逡逑后的检测结果失败,如图2-1所示。其中红色的框表示真值框,绿色的框表示预逡逑测得到的边界框,即便绿色的框被正确识别为汽车,但是由于绿色框与红色框的逡逑IOU小于阈值,一般为0.5,还是认为没有正确的检测出汽车。因此,我们需要逡逑对预测框进行微调,经过微调后的预测框与真值框更加接近,使得预测框的定位逡逑更加准确。逡逑、一逡逑B逦^逡逑....邋'邋.逡逑匕:逡逑图2-丨预测边界框与真值框对比示意图逡逑对于一个边界框一般使用四维向量(x,y,w,邋h)表示,分别代表边界框逡逑的中心点坐标以及长和宽。通过边界框回归得到的映射结果如图2-2所示,红色逡逑框表示目标的真值框G,绿色框表示检测得到的边界框P。边界框回归的目标是逡逑寻找一种关系使得输入检测得到的边界框P经过映射得到一个更接近于真值框逡逑9逡逑
通过平移和尺度缩放可以实现上述的映射关系。首先对边界框的中心点坐标逡逑做平移,然后再对边界框的宽和高做尺度缩放。边界框回归就是学习四个偏移量,逡逑那么目标函数可以表示为[|义希蓿ǎ穑剑停唬
本文编号:2804859
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2804859.html