基于细粒度特征获取的行人再识别与目标跟踪研究
发布时间:2021-03-19 22:49
近两年,5G时代的到来给人工智能行业带来了前所未有的机遇与挑战。行人再识别与目标跟踪作为计算机视觉中两个重要的组成部分,其在智能安防中起到了不可或缺的地位与作用,近年来同样得到了广泛的研究并取得了可观的研究成果。不幸的是目前的研究中,行人再识别方面,在光线较暗的情况下,识别效果会受到很大干扰。目标跟踪方面,大多数追踪方法的目标定位模块并不理想且目标运动速度过快时,极易发生追踪失败。为了解决这些问题,本文分别提出了一种用于行人再识别跨模态问题的交叉模态多粒度特征融合网络,以及用于目标跟踪的细粒度动态规划单目标跟踪方法。论文的主要贡献及工作内容总结如下:1.本文在RGB-IR Re-ID这一领域进行了跨模态条件下的行人再识别研究。为了解决跨模态后由于图片模态不同导致的识别效果陡然下降的问题,本文提出了一个交叉模态多粒度特征融合网络,通过注意力机制辅助细粒度特征提取并将其与粗细粒度特征融合,促使网络学习不同模态之间行人身上的具有判别性的共享特征,有效的提高了识别效果。2.在目标跟踪领域,为了更准确地得到目标候选框并解决目标快速移动时跳出候选框的问题,本文提出了一种基于细粒度网络的动态规划追踪...
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
行人再识别与目标跟踪示意图
合肥工业大学硕士研究生学位论文4图1.2RGB-IR行人再识别示意图Fig1.2SchematicdiagramoftheRGB-IRpersonRe-identificationRGB-IRRe-ID任务使用的是红外摄像头采集到的视频数据,可以看出IR图像与RGB图像有着巨大的差异,IR图像相对于RGB图像少了色彩信息,这对于目前RGB域的研究来说是一种严重的干扰。目前,一些研究想要使设计的网络“适应”这种颜色的转变,那么GAN(生成对抗网络)方法是一种很好地选择。使用GAN方法可以使网络自主生成与IR图片近似的伪IR图像,丰富训练样本,使得网络在训练时更“习惯”于去学习一些与颜色无关的判别性信息,如轮廓信息,纹理信息等,从而提高训练出的模型的鲁棒性,达到更好的判别效果。此外,由于GAN网络可能带来的网络复杂性与训练难度的增加,一些研究将注意力集中于IR图片所保留的细粒度特征之上。这些细粒度特征如衣服上的图案、衣服类型往往具有显著的判别性。因此,网络能否更好的学习到这些细粒度特征成为了这些非GAN方式能否达到更好判别性的关键。1.4目标跟踪的研究现状目标跟踪任务通常是指单目标跟踪,即第一帧给定一个矩形框,并将其称之为边界框(BoundingBox)。该边界框通常是取自一个人工标注的数据库。选取边界框之后,则需采用跟踪算法在视频的后续若干帧中锁定目标行人,该任务被定义为目标跟踪。目标跟踪由四个主要部分组成,分别是负责特征提取的部分、负责构建运动模型的部分、负责构建外观模型的部分以及在线学习更新参数部分。目前实现目标跟踪的主要步骤大致可分为三步:首先,在当前帧中选定一定大小的搜索区域;其次,通过目标分类任务确定搜索区域中目标的大致位置;最后,通过损失函数对目标大致位置进行回归,得到目标的精确位置。目标跟踪在深度学习算法中被划分为
第一章绪论7图1.3目标跟踪技术难点示意图Fig1.3Schematicdiagramofthedifficultyoftargettrackingtechnology(4)尺度变化。如图1.3(g)所示,尺度变化指的是目标在运动过程中,由于地理位置由远及近或由近及远等变化造成的目标大小变化。在这类问题中,预测目标边界框大小是非常具有挑战性的任务,其预测的好坏直接影响了追踪效果。(5)高速运动。如图1.3(c)所示,该类问题大多发生在高速移动的动态目标上。这样的目标会造成目标区域目标模糊,跟踪效果显著下降。(6)光照改变。如图1.3(b)所示,这类问题是目前现实场景下最容易发生的问题。在照明条件改变时,可能存在短期的强曝光,这就导致目标前景不完整、不准确,最终导致目标跟踪失败。图a形变图b光照改变图c高速运动图d背景干扰图e平面外旋转图f平面内旋转图g尺度变化图h遮挡图i出视野
【参考文献】:
期刊论文
[1]区域块分割与融合的行人再识别[J]. 蒋建国,杨宁,齐美彬,陈翠群. 中国图象图形学报. 2019(04)
[2]多特征融合与交替方向乘子法的行人再识别[J]. 齐美彬,王慈淳,蒋建国,李佶. 中国图象图形学报. 2018(06)
[3]基于双向关系相似度函数学习的行人再识别[J]. 张娜,张福星,王强,胡玲玲,桂江生. 计算机系统应用. 2018(05)
本文编号:3090365
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
行人再识别与目标跟踪示意图
合肥工业大学硕士研究生学位论文4图1.2RGB-IR行人再识别示意图Fig1.2SchematicdiagramoftheRGB-IRpersonRe-identificationRGB-IRRe-ID任务使用的是红外摄像头采集到的视频数据,可以看出IR图像与RGB图像有着巨大的差异,IR图像相对于RGB图像少了色彩信息,这对于目前RGB域的研究来说是一种严重的干扰。目前,一些研究想要使设计的网络“适应”这种颜色的转变,那么GAN(生成对抗网络)方法是一种很好地选择。使用GAN方法可以使网络自主生成与IR图片近似的伪IR图像,丰富训练样本,使得网络在训练时更“习惯”于去学习一些与颜色无关的判别性信息,如轮廓信息,纹理信息等,从而提高训练出的模型的鲁棒性,达到更好的判别效果。此外,由于GAN网络可能带来的网络复杂性与训练难度的增加,一些研究将注意力集中于IR图片所保留的细粒度特征之上。这些细粒度特征如衣服上的图案、衣服类型往往具有显著的判别性。因此,网络能否更好的学习到这些细粒度特征成为了这些非GAN方式能否达到更好判别性的关键。1.4目标跟踪的研究现状目标跟踪任务通常是指单目标跟踪,即第一帧给定一个矩形框,并将其称之为边界框(BoundingBox)。该边界框通常是取自一个人工标注的数据库。选取边界框之后,则需采用跟踪算法在视频的后续若干帧中锁定目标行人,该任务被定义为目标跟踪。目标跟踪由四个主要部分组成,分别是负责特征提取的部分、负责构建运动模型的部分、负责构建外观模型的部分以及在线学习更新参数部分。目前实现目标跟踪的主要步骤大致可分为三步:首先,在当前帧中选定一定大小的搜索区域;其次,通过目标分类任务确定搜索区域中目标的大致位置;最后,通过损失函数对目标大致位置进行回归,得到目标的精确位置。目标跟踪在深度学习算法中被划分为
第一章绪论7图1.3目标跟踪技术难点示意图Fig1.3Schematicdiagramofthedifficultyoftargettrackingtechnology(4)尺度变化。如图1.3(g)所示,尺度变化指的是目标在运动过程中,由于地理位置由远及近或由近及远等变化造成的目标大小变化。在这类问题中,预测目标边界框大小是非常具有挑战性的任务,其预测的好坏直接影响了追踪效果。(5)高速运动。如图1.3(c)所示,该类问题大多发生在高速移动的动态目标上。这样的目标会造成目标区域目标模糊,跟踪效果显著下降。(6)光照改变。如图1.3(b)所示,这类问题是目前现实场景下最容易发生的问题。在照明条件改变时,可能存在短期的强曝光,这就导致目标前景不完整、不准确,最终导致目标跟踪失败。图a形变图b光照改变图c高速运动图d背景干扰图e平面外旋转图f平面内旋转图g尺度变化图h遮挡图i出视野
【参考文献】:
期刊论文
[1]区域块分割与融合的行人再识别[J]. 蒋建国,杨宁,齐美彬,陈翠群. 中国图象图形学报. 2019(04)
[2]多特征融合与交替方向乘子法的行人再识别[J]. 齐美彬,王慈淳,蒋建国,李佶. 中国图象图形学报. 2018(06)
[3]基于双向关系相似度函数学习的行人再识别[J]. 张娜,张福星,王强,胡玲玲,桂江生. 计算机系统应用. 2018(05)
本文编号:3090365
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3090365.html
最近更新
教材专著