基于Mask RCNN神经网络的行人重识别研究
发布时间:2021-07-25 19:15
随着信息技术的飞速发展以及对城市安防的重视程度不断提高,行人重识别作为智能视频安全监控系统的关键技术之一,正受到越来越多的重视。目前,如何获得分辨力和泛化能力更强的行人特征、将行人重识别与行人检测结合以应用到真实场景中是行人重识别的两个重要研究方向。通过对行人重识别的研究发现,传统行人重识别使用的数据集图像通过行人检测方式获得,这些图像中总是存在不少背景、遮挡、其他行人等干扰,影响行人特征提取效果。为了解决这个问题,本文使用Mask RCNN实例分割神经网络在检测行人的同时去除背景等干扰,避免其对行人重识别特征提取过程造成负面影响。考虑到行人携带的物体有助于行人的特征表示,提出结合这些物体的行人重识别特征提取方法。对于Mask RCNN的图像分割部分对图像特征利用不足,导致图像分割效果不佳的问题,参考语义分割方法对该部分进行改进,并完成改进后的Mask RCNN实例分割神经网络的搭建。在行人实例分割的同时,将行人携带的物体如背包、伞、手提包、手提箱保留下来,在行人重识别阶段与行人特征结合构建出行人混合特征,并完成行人重识别神经网络模型的搭建。最后结合改进后的Mask RCNN和行人重识...
【文章来源】:西安科技大学陕西省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
行人重识别系统
?治?傅确荩?佣?进行头部、上身、腿部等身体部分的划分,文献[20]中使用了孪生网络,其使用的损失函数是用于度量学习方法的对比损失函数。该方法先将输入的两幅图片均分为n份后,将它们按照从上到下的顺序输入一个长短时记忆神经网络,得到各个部分的局部特征,最后使用特征融合的方式将所有局部特征结合在一起,得到行人总特征。但是图片切块方法的缺点也很明显,即其需要首先对图片进行对齐的,如果使用的两张图片对齐的效果不佳,那么会出现将行人的头与其腰腹部进行对比的现象,这反而会使得神经网络模型判断错误。如图1.2所示:图1.2图片切块方法缺点
集扩充。随着GAN神经网络的不断发展,其已经不再只能生成随机图片,CycleGAN[23]、DualGAN[24]和DiscoGAN[25]可以进行对输入图片的转换,以扩大数据集。文献[26]首先使用GAN神经网络协助行人重识别的研究,其使用了GAN随机生成行人图片作为行人重识别神经网络训练数据的增广,间接的提高该文献所使用的IDE网络的性能。由于监控摄像头所处的光线、角度等可能有所不同,因此这些摄像头拍摄的视频风格之间可能存在偏差,Zhong等人提出使用CycleGAN从而实现不同相机风格之间的转换,以减小它们之间的风格偏差[27],如图1.3所示。此外,由于不同数据集的应用场景不同,因此它们之间的场景偏差也不可忽视,因此经常出现在一个数据集上训练好的高性能神经网络,在其它数据集上出现性能降低的情况。为了解决这个问题,文献[28]基于CycleGAN提出了更适合行人重识别的personGAN。图1.3相机风格转换1.3本文研究内容目前的行人重识别研究基于Market1501[29]、CUHK03[30]、DukeMTMC[31]等行人重识别公开数据集,在这些数据集中,行人图像都是已经裁剪好的。而且用于这些数据集的行人重识别方法已经能获得很高的准确度,但将它们应用于整个端到端的行人重识别系
【参考文献】:
期刊论文
[1]基于深度学习的行人重识别研究进展[J]. 罗浩,姜伟,范星,张思朋. 自动化学报. 2019(11)
[2]国家九部委:出台《关于加强公共安全视频监控建设联网应用工作的若干意见》[J]. 中国信息安全. 2015(06)
[3]浅析平安城市视频监控大联网的发展[J]. 魏一. 中国安防. 2013(03)
[4]广州城市居民消费行为与生活质量研究[J]. 广州市城调队课题组,余家荣. 广东经济. 2006(12)
博士论文
[1]基于度量学习的行人重识别方法研究[D]. 王金.华中科技大学 2017
硕士论文
[1]融合局部特征的行人重识别神经网络模型[D]. 李天霖.西安电子科技大学 2019
[2]基于深度学习的行人重识别技术研究[D]. 李强.西安电子科技大学 2019
[3]基于目标辅助信息的行人重识别方法[D]. 陈普.西安电子科技大学 2019
[4]基于深度学习的行人重识别方法研究[D]. 吴江.电子科技大学 2019
[5]基于语义一致性的多视角行人再识别研究[D]. 毛超杰.浙江大学 2018
本文编号:3302612
【文章来源】:西安科技大学陕西省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
行人重识别系统
?治?傅确荩?佣?进行头部、上身、腿部等身体部分的划分,文献[20]中使用了孪生网络,其使用的损失函数是用于度量学习方法的对比损失函数。该方法先将输入的两幅图片均分为n份后,将它们按照从上到下的顺序输入一个长短时记忆神经网络,得到各个部分的局部特征,最后使用特征融合的方式将所有局部特征结合在一起,得到行人总特征。但是图片切块方法的缺点也很明显,即其需要首先对图片进行对齐的,如果使用的两张图片对齐的效果不佳,那么会出现将行人的头与其腰腹部进行对比的现象,这反而会使得神经网络模型判断错误。如图1.2所示:图1.2图片切块方法缺点
集扩充。随着GAN神经网络的不断发展,其已经不再只能生成随机图片,CycleGAN[23]、DualGAN[24]和DiscoGAN[25]可以进行对输入图片的转换,以扩大数据集。文献[26]首先使用GAN神经网络协助行人重识别的研究,其使用了GAN随机生成行人图片作为行人重识别神经网络训练数据的增广,间接的提高该文献所使用的IDE网络的性能。由于监控摄像头所处的光线、角度等可能有所不同,因此这些摄像头拍摄的视频风格之间可能存在偏差,Zhong等人提出使用CycleGAN从而实现不同相机风格之间的转换,以减小它们之间的风格偏差[27],如图1.3所示。此外,由于不同数据集的应用场景不同,因此它们之间的场景偏差也不可忽视,因此经常出现在一个数据集上训练好的高性能神经网络,在其它数据集上出现性能降低的情况。为了解决这个问题,文献[28]基于CycleGAN提出了更适合行人重识别的personGAN。图1.3相机风格转换1.3本文研究内容目前的行人重识别研究基于Market1501[29]、CUHK03[30]、DukeMTMC[31]等行人重识别公开数据集,在这些数据集中,行人图像都是已经裁剪好的。而且用于这些数据集的行人重识别方法已经能获得很高的准确度,但将它们应用于整个端到端的行人重识别系
【参考文献】:
期刊论文
[1]基于深度学习的行人重识别研究进展[J]. 罗浩,姜伟,范星,张思朋. 自动化学报. 2019(11)
[2]国家九部委:出台《关于加强公共安全视频监控建设联网应用工作的若干意见》[J]. 中国信息安全. 2015(06)
[3]浅析平安城市视频监控大联网的发展[J]. 魏一. 中国安防. 2013(03)
[4]广州城市居民消费行为与生活质量研究[J]. 广州市城调队课题组,余家荣. 广东经济. 2006(12)
博士论文
[1]基于度量学习的行人重识别方法研究[D]. 王金.华中科技大学 2017
硕士论文
[1]融合局部特征的行人重识别神经网络模型[D]. 李天霖.西安电子科技大学 2019
[2]基于深度学习的行人重识别技术研究[D]. 李强.西安电子科技大学 2019
[3]基于目标辅助信息的行人重识别方法[D]. 陈普.西安电子科技大学 2019
[4]基于深度学习的行人重识别方法研究[D]. 吴江.电子科技大学 2019
[5]基于语义一致性的多视角行人再识别研究[D]. 毛超杰.浙江大学 2018
本文编号:3302612
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3302612.html
最近更新
教材专著