自然场景下行人再识别技术研究及实现
发布时间:2021-01-26 03:01
行人再识别是计算机视觉领域的一项重要技术,能够在跨域监控系统中识别和跟踪不同的行人,对于刑侦探案、流量分析、寻找丢失的老人和儿童等都具有重要的现实意义。近几年,行人再识别技术得到了广泛的关注,尤其是随着卷积神经网络的应用,极大地促进了端到端的行人再识别技术的发展,也出现了许多研究子类。但是在实际应用中行人再识别任务也面临着一些困难和挑战,比如缺乏大量的训练数据,当前收集到的数据与真实数据的时空分布相比是非常有限的;而且受不同摄像头设置角度、光照变化、背景差异、姿态变化等的影响,行人的视觉特征会发生剧烈变化,增大了匹配难度。如何克服上述因素带来的影响,是解决行人再识别技术的关键。本文基于自然场景下采集的监控视频数据进行行人再识别研究,通过对传统手工设计与卷积神经网络方法进行分析和对比,对整体的研究有了更清晰的认识。本文重点对基于对抗生成网络的行人再识别方法进行研究,对抗生成网络具有生成样本的能力,当前在行人再识别领域得到了广泛的应用。针对数据集存在的训练样本不足以及季节差异问题,本文基于对抗生成网络及其衍变模型进行图像风格转换研究,提出了一个解决方案来完成多场景下的冬夏季节迁移。在循环对...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图1-1行人再识别查询步骤??与上述过程相对应,行人再识别任务可以划分成独立的两个步骤:特征提取??和距离计算,可以针对其中一个方面进行专门研宄来提高模型的准确率
(4)数据影响??首先是行人数据收集困难,导致训练数据不足。当前,我们很难收集到跨时??间、跨气候和多场景的大规模行人数据,远远达不到真实数据要求的广泛性时分布。而且与其他视觉任务相比,公开数据集的规模也非常小,当前最大规模行人再识别数据集仅有4000多个行人,共12万多张行人图片,远达不到实际用的需求。??其次是数据集的制作和发布比较困难。与其他公开数据集制作不同,行人再??识别任务需要依赖人工对每张行人图像进行标注,这会消耗大量的人力和物力。??而且标注本身有时也存在问题,在视频中要想把两个年龄、体貌相似、穿着相同??的行人区分开是比较困难的。另外,隐私保护也是需要考虑的难点,行人图像般包含行人的面部和肢体信息,发布数据集之前需要对行人进行脱敏处理。??1.3研究内容??本文主要研究了自然场景下行人再识别技术的主流算法与研究热点,工作内??:??
基于视频序列的方法主要思想是构建混合网络,一方面通过卷积神经网络来??提取空间特征,另一方面利用循环神经网络(RecurrentNeuralNetworks,RNN)??[3()]来提取时序特征。整个网络的输入为图像序列,过程如图2-1所示。??<帧1???卷积网络??循环网络????特??行人1? ̄一帧2——^卷积网络——?循环网络——??J????\帧3???卷积网络??循环网络???u??距离计算??^帧1???卷积网络??循环网络???ik??i?特????I?量??\帧3???卷积网络??循环网络????图2-1基于视频序列的行人再识别流程??每张图像都经过一个共享的CNN提取出图像空间特征,然后这些特征向量??被输入到一个RNN网络去提取时序特征。最终的特征表示融合了单帧图像的特??征和帧与帧之间的时序特征,用于代替前面单帧方法的特征向量来训练网络。这??种方法能够充分利用多帧数据的信息,提取出更有辨别力的行人特征。这对于行??人追踪技术是十分重要的,因为通过绘制行人的运动轨迹,能够不断分析和追踪??行人,帮助预判行人的出现位置。??2.2.4行人对齐??大多数现有的行人再识别方法侧重于学习有监督的身份辨别信息,但无论是??特征提取还是距离度量,甚至深度学习方法都假设行人的图像是严格对齐的,这??在实际应用场景中几乎是不可能实现的。因为行人检测器会存在偏差
本文编号:3000352
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图1-1行人再识别查询步骤??与上述过程相对应,行人再识别任务可以划分成独立的两个步骤:特征提取??和距离计算,可以针对其中一个方面进行专门研宄来提高模型的准确率
(4)数据影响??首先是行人数据收集困难,导致训练数据不足。当前,我们很难收集到跨时??间、跨气候和多场景的大规模行人数据,远远达不到真实数据要求的广泛性时分布。而且与其他视觉任务相比,公开数据集的规模也非常小,当前最大规模行人再识别数据集仅有4000多个行人,共12万多张行人图片,远达不到实际用的需求。??其次是数据集的制作和发布比较困难。与其他公开数据集制作不同,行人再??识别任务需要依赖人工对每张行人图像进行标注,这会消耗大量的人力和物力。??而且标注本身有时也存在问题,在视频中要想把两个年龄、体貌相似、穿着相同??的行人区分开是比较困难的。另外,隐私保护也是需要考虑的难点,行人图像般包含行人的面部和肢体信息,发布数据集之前需要对行人进行脱敏处理。??1.3研究内容??本文主要研究了自然场景下行人再识别技术的主流算法与研究热点,工作内??:??
基于视频序列的方法主要思想是构建混合网络,一方面通过卷积神经网络来??提取空间特征,另一方面利用循环神经网络(RecurrentNeuralNetworks,RNN)??[3()]来提取时序特征。整个网络的输入为图像序列,过程如图2-1所示。??<帧1???卷积网络??循环网络????特??行人1? ̄一帧2——^卷积网络——?循环网络——??J????\帧3???卷积网络??循环网络???u??距离计算??^帧1???卷积网络??循环网络???ik??i?特????I?量??\帧3???卷积网络??循环网络????图2-1基于视频序列的行人再识别流程??每张图像都经过一个共享的CNN提取出图像空间特征,然后这些特征向量??被输入到一个RNN网络去提取时序特征。最终的特征表示融合了单帧图像的特??征和帧与帧之间的时序特征,用于代替前面单帧方法的特征向量来训练网络。这??种方法能够充分利用多帧数据的信息,提取出更有辨别力的行人特征。这对于行??人追踪技术是十分重要的,因为通过绘制行人的运动轨迹,能够不断分析和追踪??行人,帮助预判行人的出现位置。??2.2.4行人对齐??大多数现有的行人再识别方法侧重于学习有监督的身份辨别信息,但无论是??特征提取还是距离度量,甚至深度学习方法都假设行人的图像是严格对齐的,这??在实际应用场景中几乎是不可能实现的。因为行人检测器会存在偏差
本文编号:3000352
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3000352.html
最近更新
教材专著