基于深度学习的行人再识别技术研究与应用
发布时间:2020-03-30 19:55
【摘要】:行人再识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,即给定一个或一段监控行人图像,要求机器可以自动检索跨摄像头设备下该行人图像以进行对行人的追踪与定位。该类算法旨在弥补目前固定的摄像头的视觉局限,并可与行人检测/跟踪技术一起广泛应用于智能视频监控、智能安保等领域。行人再识别的数据中经常存在如下几类噪音:图像分辨率较低、行人姿势不同、光照变化以及相机视角不同等。这些噪音导致不同摄像机所拍摄的同一个行人图像在视觉表观特征上常常存在较大差别。目前现有方法大多将研究重点放在如何从整张图片中提取更加鲁棒的行人特征,而忽略了图片本身质量对结果的干扰。本文从解决图片低分辨率的角度出发,针对行人再识别数据库中行人图像分辨率较低、不同行人的视觉特征过于相似的问题提出了一套基于深度学习的行人再识别算法(自动权重卷积神经网络)。本文主要贡献如下:1、本文提出用对抗生成网络对图像像素进行信息增强,该算法以对抗博弈训练为基础,生成器与判别器互为约束,学习出从低分辨率到高分辨率的合适映射关系,将原始低分辨率图像重建为高分辨率图像,恢复图像中的纹理细节。2、针对输入图像质量较差的情况,本文进一步提出自动权重分配网络,在传统的深度学习分类网络基础上引入图像语义信息参与分类,对图像的不同区域自动分配合适的权重,从而使网络能够自动提取每个行人身上最具有代表性的特征。3、本文在实验过程中发现,比起仅仅使用传统交叉熵或者三元组损失函数,使用二者的组合损失函数表现更好。该组合损失函数能够在最大化行人图像的类间距离,最小化行人图像的类内距离的同时保持整体分类的约束条件。4、本文在两个具有挑战性的行人再识别数据集iLIDS-VID和PRID-2011上进行实验,实验结果表明本文所提出的算法有效地减少了低分辨率对行人外观的影响,并减轻了行人特征混淆的问题,显著提高了行人再识别的识别率。5、本文进一步将所提出模型与基准模型(去除所有本文提出算法的模型)在同样行人图像上提取的特征进行降维可视化,可视化的结果有力地证明本文所提出的算法能够减轻相机之间的差异与行人姿态差异对最终特征造成的影响,有效拉近来自不同摄像机的同一行人的特征。
【图文】:
于身体所占面积更大,因此从行人整个身体提取特征更加容易,,提取出的特征逡逑也更具有辨别力。逡逑目前行人再识别问题己经引起了研究人员的广泛重视。图1-1中展示了近逡逑年以来在国际顶级计算机视觉会议CVPR与ICCV/ECCV上发表的行人再识别逡逑工作数量。可以看到,近年来行人再识别的论文数量呈爆炸式的X棾ぁ4罅靠棋义涎谢褂胙=腥嗽偈侗鹱魑匾难芯糠较颍⑻岢隽撕芏嘤屑壑档乃惴ㄥ义希郏担叮罚福
本文编号:2607986
【图文】:
于身体所占面积更大,因此从行人整个身体提取特征更加容易,,提取出的特征逡逑也更具有辨别力。逡逑目前行人再识别问题己经引起了研究人员的广泛重视。图1-1中展示了近逡逑年以来在国际顶级计算机视觉会议CVPR与ICCV/ECCV上发表的行人再识别逡逑工作数量。可以看到,近年来行人再识别的论文数量呈爆炸式的X棾ぁ4罅靠棋义涎谢褂胙=腥嗽偈侗鹱魑匾难芯糠较颍⑻岢隽撕芏嘤屑壑档乃惴ㄥ义希郏担叮罚福
本文编号:2607986
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2607986.html