基于多伯努利视频多目标检测跟踪算法研究
发布时间:2021-01-10 22:31
视频多目标跟踪是目标跟踪领域的一个重要分支,作为经典的计算机视觉问题,多目标跟踪在智能视频监控、智能交通管制及无人驾驶等领域有着广泛的应用。复杂环境下视频多目标跟踪应用中,除了光照变化、目标形变和目标遮挡等问题,目标数目未知、新生目标不确定、图像模糊及杂波干扰等复杂问题,也一直是多目标跟踪领域中研究的难点。本文主要围绕多伯努利滤波在视频多目标跟踪中的应用,结合目标检测展开深入研究,取得如下研究成果。1.针对多伯努利滤波方法在多目标跟踪中,难以检测新生目标,且当目标出现互相遮挡等干扰时,跟踪精度下降,甚至出现目标漏跟,以及当漏跟目标被重新跟踪后,与之前运动轨迹难以关联等问题,本文在多伯努利滤波框架下,结合YOLOv3检测结果,并采用卷积特征对目标进行描述,计算相邻帧目标的相似度矩阵,设计新生目标识别和漏跟目标的重识别策略,以实现对目标新生的判别和漏跟目标的连续估计;此外,在模板更新时,融合高置信度检测,提出遮挡目标处理机制,有效提高目标跟踪精度。最后,采用标准数据集中具有挑战性的视频序列进行算法测试,验证了提出算法的有效性。2.针对目标检测器在实际应用中,受目标遮挡、背景复杂、目标视频模...
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
Faster-RCNN基本结构
第二章视频目标检测与跟踪理论9图2-4YOLOv3目标检测原理YOLOv3采用Darknet-53作为特征提取的网络,该网络结构如图2-5所示,由连续的33和11卷积层组成,融合残差网络(ResidualNeuralNetwork,ResNet)的残差块(ResidualBlock),将整个网络分为多个子段逐阶段训练,采用shortcut的连接方式对每个子段的残差进行训练,从而达到总体残差最校YOLOv3在三个不同尺度上预测边界框,每个尺度预测3个边界框,尺度内进行局部特征交互,在基础网络之后,添加一系列卷积层得到特征图,在此基础上,进行位置回归与分类,此过程为最小尺度预测;将上一尺度中的卷积层上采样与最后一个1616大小的特征图连接,再次通过多个卷积后输出预测信息;同理,将中间尺度的卷积层上采样与最后一个3232大小的特征图连接,经过一系列卷积得到最大尺度上的边界框预测。TypeFilterSizeOutputConvolutional323x3256x256Convolutional643x3/2128x128Convolutional321x1Convolutional643x3Residual128x1281xConvolutional1283x3/264x64Convolutional641x1Convolutional1283x3Residual64x642xConvolutional2563x3/232x32Convolutional1281x18xConvolutional2563x3Residual32x32Convolutional2561x18xConvolutional5123x3Residual16x16Convolutional5123x3/216x16Convolutional5121x14xConvolutional10243x3Residual8x8Convolutional10243x3/28x8AvgpoolGlobalConnected1000SoftmaxConvsConvsConvsYOLOv3Detectionscale1scale2scale3图2-5Darknet-53网络结构
江南大学硕士论文16在目标特征图上进行背景信息减除:(),1,,obobiiiiiCCCFFIid(3-3)提取弱化背景信息的特征图1{}diiCC,将特征图按行展开并顺序拼接,得到最终的一维卷积特征f,其中,2(nw)dfR。(3)相似度计算为了更准确地评价两个框的相似程度,本章在目标跟踪过程中,通过式(3-4),计算出相似度,用于目标模板、检测框、跟踪框等之间的相似性度量,12||||()hfffhgfe(3-4)其中,hf、f分别为两个框的卷积特征,12f表示f的二范数。3.2基于YOLOv3检测的多伯努利视频多目标跟踪本章在多伯努利滤波框架下,引入YOLOv3检测算法对视频帧进行预检测,通过计算相邻帧检测框的相似度矩阵,并进行检测框的初步匹配,加入目标标签信息识别身份,融合高置信度检测框、目标轨迹和目标模板,以剔除干扰杂波,提出目标新生识别和漏跟目标重识别策略以实现对目标轨迹的连续估计,此外,设计目标遮挡处理机制,提出目标模板自适应更新策略,进一步实现多目标的优化跟踪。本章算法基本框架如图3-1所示。图3-1提出算法的框架图3.2.1相邻帧目标检测(1)相邻帧目标检测采用YOLOv3算法检测第k和k1帧视频序列,记第k帧检测框个数为n,检测框状态集为1{}iklnkkiSs,第k1帧检测框个数为m,其检测框状态集为1111{}iklmkkiSs,其中,[,,,,]iiiiikkkkklllllikkkkkksxywhl表示第i个检测框状态向量,参数,,,,iiiikkkkllllikkkkkxywhl=h分别表示第k帧第i个检测框左上角的横坐标、纵坐标,以及检测框的宽、高和标签。(2)相似度矩阵计算
【参考文献】:
期刊论文
[1]计算机视频监控系统设计及应用研究[J]. 梁静. 电子设计工程. 2019(13)
[2]智能交通系统主要技术的发展[J]. 陆化普. 科技导报. 2019(06)
[3]卷积特征多伯努利视频多目标跟踪算法[J]. 杨金龙,汤玉,张光南. 计算机科学与探索. 2019(11)
[4]标签一致K-SVD稀疏编码视频跟踪算法[J]. 杨金龙,陈小平,汤玉,徐壮. 计算机辅助设计与图形学学报. 2018(02)
[5]基于视觉的目标检测与跟踪综述[J]. 尹宏鹏,陈波,柴毅,刘兆栋. 自动化学报. 2016(10)
[6]空中预警和控制系统的发展趋势[J]. 张颖,吴剑勇,秦五诗. 国际航空. 2007(11)
本文编号:2969537
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
Faster-RCNN基本结构
第二章视频目标检测与跟踪理论9图2-4YOLOv3目标检测原理YOLOv3采用Darknet-53作为特征提取的网络,该网络结构如图2-5所示,由连续的33和11卷积层组成,融合残差网络(ResidualNeuralNetwork,ResNet)的残差块(ResidualBlock),将整个网络分为多个子段逐阶段训练,采用shortcut的连接方式对每个子段的残差进行训练,从而达到总体残差最校YOLOv3在三个不同尺度上预测边界框,每个尺度预测3个边界框,尺度内进行局部特征交互,在基础网络之后,添加一系列卷积层得到特征图,在此基础上,进行位置回归与分类,此过程为最小尺度预测;将上一尺度中的卷积层上采样与最后一个1616大小的特征图连接,再次通过多个卷积后输出预测信息;同理,将中间尺度的卷积层上采样与最后一个3232大小的特征图连接,经过一系列卷积得到最大尺度上的边界框预测。TypeFilterSizeOutputConvolutional323x3256x256Convolutional643x3/2128x128Convolutional321x1Convolutional643x3Residual128x1281xConvolutional1283x3/264x64Convolutional641x1Convolutional1283x3Residual64x642xConvolutional2563x3/232x32Convolutional1281x18xConvolutional2563x3Residual32x32Convolutional2561x18xConvolutional5123x3Residual16x16Convolutional5123x3/216x16Convolutional5121x14xConvolutional10243x3Residual8x8Convolutional10243x3/28x8AvgpoolGlobalConnected1000SoftmaxConvsConvsConvsYOLOv3Detectionscale1scale2scale3图2-5Darknet-53网络结构
江南大学硕士论文16在目标特征图上进行背景信息减除:(),1,,obobiiiiiCCCFFIid(3-3)提取弱化背景信息的特征图1{}diiCC,将特征图按行展开并顺序拼接,得到最终的一维卷积特征f,其中,2(nw)dfR。(3)相似度计算为了更准确地评价两个框的相似程度,本章在目标跟踪过程中,通过式(3-4),计算出相似度,用于目标模板、检测框、跟踪框等之间的相似性度量,12||||()hfffhgfe(3-4)其中,hf、f分别为两个框的卷积特征,12f表示f的二范数。3.2基于YOLOv3检测的多伯努利视频多目标跟踪本章在多伯努利滤波框架下,引入YOLOv3检测算法对视频帧进行预检测,通过计算相邻帧检测框的相似度矩阵,并进行检测框的初步匹配,加入目标标签信息识别身份,融合高置信度检测框、目标轨迹和目标模板,以剔除干扰杂波,提出目标新生识别和漏跟目标重识别策略以实现对目标轨迹的连续估计,此外,设计目标遮挡处理机制,提出目标模板自适应更新策略,进一步实现多目标的优化跟踪。本章算法基本框架如图3-1所示。图3-1提出算法的框架图3.2.1相邻帧目标检测(1)相邻帧目标检测采用YOLOv3算法检测第k和k1帧视频序列,记第k帧检测框个数为n,检测框状态集为1{}iklnkkiSs,第k1帧检测框个数为m,其检测框状态集为1111{}iklmkkiSs,其中,[,,,,]iiiiikkkkklllllikkkkkksxywhl表示第i个检测框状态向量,参数,,,,iiiikkkkllllikkkkkxywhl=h分别表示第k帧第i个检测框左上角的横坐标、纵坐标,以及检测框的宽、高和标签。(2)相似度矩阵计算
【参考文献】:
期刊论文
[1]计算机视频监控系统设计及应用研究[J]. 梁静. 电子设计工程. 2019(13)
[2]智能交通系统主要技术的发展[J]. 陆化普. 科技导报. 2019(06)
[3]卷积特征多伯努利视频多目标跟踪算法[J]. 杨金龙,汤玉,张光南. 计算机科学与探索. 2019(11)
[4]标签一致K-SVD稀疏编码视频跟踪算法[J]. 杨金龙,陈小平,汤玉,徐壮. 计算机辅助设计与图形学学报. 2018(02)
[5]基于视觉的目标检测与跟踪综述[J]. 尹宏鹏,陈波,柴毅,刘兆栋. 自动化学报. 2016(10)
[6]空中预警和控制系统的发展趋势[J]. 张颖,吴剑勇,秦五诗. 国际航空. 2007(11)
本文编号:2969537
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2969537.html
最近更新
教材专著