基于多镜头转换GAN的行人重识别研究
发布时间:2021-01-25 15:24
行人重识别是近年来在计算机视觉领域兴起的一项新技术,它是许多安防和监控应用中的重要任务,在计算机视觉研究领域上也引起了越来越多的关注。行人重识别指的是在非重叠镜头视域中检索出目标行人。由于多个镜头拍摄的场景和拍摄角度是完全不相同的,假设我们要对某个镜头中拍摄到的目标行人进行重识别,即在其他的镜头中检索该行人,除了要考虑目标行人本身在不同镜头下外观上的不同,还要考虑其他行人的影响,比如该目标行人需要与其它镜头中的多个行人都进行比较。随着生成对抗网络模型的提出和相关算法的不断演变,基于生成对抗网络的行人重识别研究也取得了良好的进展,利用生成对抗网络生成的图像进行网络模型训练,很好的提升了性能。目前,行人重识别在单个数据集下的性能已经有了显著的提高,但在一个行人数据集下训练的模型,常常不能很好的推广到另一个行人数据集。本文的主要工作如下:(1)由于行人重识别也是图像检索的子问题,本文了引入了细粒度图像检索的思想。本文提出了混合选择性卷积描述符聚合的方法,该方法将选择性卷积描述符聚合的特征与全局平均池化特征相结合,得到最终的行人特征。这种方法可以选择有用的深度描述子,同时通过定位图像中的行人目...
【文章来源】:长沙理工大学湖南省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图2.3CUHK01数据集图片??Market-1501[38]总共32643张来自6个不同的摄像头的图像,如图2.4所示,包含了??
?硕士学位论文???张行人图片组成,包含了?632个不同的行人,行人图像的分辨率统一为]28*48。??…為A':龜,,??讀_??图2.2?VIPeK数据集图片??CUHK01【i4缴据集在VIPeR数据集的基础上进行了扩充。该数据集中的图片也由两??个相机拍摄,两个相机的视角不同,如图2.3所示,每个行人都出现在两个不同的视角??中。不同的是,每个行人在每个相机中都采集了两张图片。数据集由3884张行人图片??组成,包含了?971个不同的行人,行人图像的分辨率统一为160*60。??|麵’??mm??图2.3CUHK01数据集图片??Market-1501[38]总共32643张来自6个不同的摄像头的图像,如图2.4所示,包含了??1501个身份。其中训练集包含12936张图片,共751个不同行人;测试集包含19732张??图片,包含750个不同行人。此外,这个数据集还包含了?DPM检测到的2793个错误图??12??
?第二章相关理论概述???片,作为真实场景的干扰。每个ID至少出现在两个摄像头,使得跨摄像头查询是可行??的。在同摄像头下,同一个ID可以有不同的外观。在ICCV?2015年发布版本的后期,??集成了?500K的干扰项,使这个数据集非常大。在该数据集中,作者还使用mAP作为评??价标准对算法进行了测试。??DukeMTMC-relDfM数据集中的图片来自8个视角不同的摄像头,一共包含36411??张行人图像,共有1404个不同的行人,每个行人都出现在了多个相机镜头中。其中训??练集中包含了?702个不同行人的16522张图片,测试集中包含了另外702个不同的行??人。测试集中,查询库中包含2228张查询图像,搜索库中包含17661张行人图像,均??来自这702个不同的行人中。此外,在搜索库中,还额外加入了?408人作为干扰,以模??拟真实的应用场景。??IIMi麵鈐.屢猶.??猫漏鱗誦??f?mm??图2.4?Market-1501数据集图片??m??■?£?鬧??国_1議1顧’??^?7?siM?If?yy??图2.5MSMT17数据集图片??13??
本文编号:2999462
【文章来源】:长沙理工大学湖南省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图2.3CUHK01数据集图片??Market-1501[38]总共32643张来自6个不同的摄像头的图像,如图2.4所示,包含了??
?硕士学位论文???张行人图片组成,包含了?632个不同的行人,行人图像的分辨率统一为]28*48。??…為A':龜,,??讀_??图2.2?VIPeK数据集图片??CUHK01【i4缴据集在VIPeR数据集的基础上进行了扩充。该数据集中的图片也由两??个相机拍摄,两个相机的视角不同,如图2.3所示,每个行人都出现在两个不同的视角??中。不同的是,每个行人在每个相机中都采集了两张图片。数据集由3884张行人图片??组成,包含了?971个不同的行人,行人图像的分辨率统一为160*60。??|麵’??mm??图2.3CUHK01数据集图片??Market-1501[38]总共32643张来自6个不同的摄像头的图像,如图2.4所示,包含了??1501个身份。其中训练集包含12936张图片,共751个不同行人;测试集包含19732张??图片,包含750个不同行人。此外,这个数据集还包含了?DPM检测到的2793个错误图??12??
?第二章相关理论概述???片,作为真实场景的干扰。每个ID至少出现在两个摄像头,使得跨摄像头查询是可行??的。在同摄像头下,同一个ID可以有不同的外观。在ICCV?2015年发布版本的后期,??集成了?500K的干扰项,使这个数据集非常大。在该数据集中,作者还使用mAP作为评??价标准对算法进行了测试。??DukeMTMC-relDfM数据集中的图片来自8个视角不同的摄像头,一共包含36411??张行人图像,共有1404个不同的行人,每个行人都出现在了多个相机镜头中。其中训??练集中包含了?702个不同行人的16522张图片,测试集中包含了另外702个不同的行??人。测试集中,查询库中包含2228张查询图像,搜索库中包含17661张行人图像,均??来自这702个不同的行人中。此外,在搜索库中,还额外加入了?408人作为干扰,以模??拟真实的应用场景。??IIMi麵鈐.屢猶.??猫漏鱗誦??f?mm??图2.4?Market-1501数据集图片??m??■?£?鬧??国_1議1顧’??^?7?siM?If?yy??图2.5MSMT17数据集图片??13??
本文编号:2999462
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2999462.html
最近更新
教材专著