基于正交语义特征分解的行人检索研究
发布时间:2021-08-28 11:36
随着社会安全意识的提升和多媒体技术的发展,监控设备被广泛布设于人们的生产生活中。但是仅依靠人力分析大量的视频数据无法达到高精度、实时性的安全保障。所以为监控视频设计智能分析算法具有非常重要的研究意义。本文着重研究监控视频智能化的行人检测方法和行人重识别方法,基于卷积神经网络,提出端到端的行人检索融合模型。对于行人重识别问题,身份特征和与身份无关的特征高度耦合,导致模型在训练过程中被无关信息干扰,影响识别准确率。本文提出行人语义特征模型,并在深度特征图上使用施密特正交化特征分解技术,将身份特征与身份无关特征分离,对解耦合的身份特征分别使用表征学习策略和度量学习策略训练。实验证明在深度网络中的特征分离有效地提高了行人重识别模型的识别准确率。为实现端到端的行人检索模型,本文令YOLO-v3目标检测模型与改进的行人重识别模型共享特征提取网络。共享的特征提取网络会导致检测模型和重识别模型互相干扰,影响检测和识别的准确率。本文将深度语义特征模型引入共享特征提取网络,设计任务分离层。实验证明,任务分离层有效地分离了行人的共性特征和个性特征,解决了互相干扰的矛盾。
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1.2本文研究流程??Fig.?1.2?Research?Process??
?大连海事大学专业学位硕士学位论文???2特征提取网络??目前主流的目标检测模型和行人重识别模型都基于卷积神经网络。卷积神经网络的??主要功能是提取输入图像的深度语义特征,不同的视觉任务模型釆用不同的方法处理该??深度语义特征。本文将目标检测和行人重识别中使用的神经网络统一看作特征提取网??络,将深度语义特征的提取作为图像的预处理来研究。??2.1输入图像预处理??卷积神经网络可以一次性处理多个输入图像,通常称网络的输入为批数据??(minibatch)。批数据是经过预处理后的四维张瑣,大小形式为(TV?x?C?x?//?x?IV)。??其中iV表示网络一次处理iV张图像;C表示输入图像的通道数,通常输入图像是RGB??格式的彩色图像,所以C?=?3;?//和分别代表输入图像的高和宽。??为了实现成批次地处理,通常对iV张输入图像进行如下的预处理:??⑴随机裁剪(random?crop)??i=iii??图2.1随机裁剪示意图??Fig.?2.1?Random?Crop??如图2.1,按一定的概率随机从原始图像中截取一张子图作为网络的输入图片。随机??截取使输入图像仅保留原始图像的局部区域,在模型的训练过程中,弱化数据的噪声,??丰富训练数据的数fi,防止过拟合现象的发生,增加了模型的稳定性。??n??图2.2随机水平翻转示意图??Fig.?2.2?Random?Horizontal?Flip??-7?-??
?大连海事大学专业学位硕士学位论文???2特征提取网络??目前主流的目标检测模型和行人重识别模型都基于卷积神经网络。卷积神经网络的??主要功能是提取输入图像的深度语义特征,不同的视觉任务模型釆用不同的方法处理该??深度语义特征。本文将目标检测和行人重识别中使用的神经网络统一看作特征提取网??络,将深度语义特征的提取作为图像的预处理来研究。??2.1输入图像预处理??卷积神经网络可以一次性处理多个输入图像,通常称网络的输入为批数据??(minibatch)。批数据是经过预处理后的四维张瑣,大小形式为(TV?x?C?x?//?x?IV)。??其中iV表示网络一次处理iV张图像;C表示输入图像的通道数,通常输入图像是RGB??格式的彩色图像,所以C?=?3;?//和分别代表输入图像的高和宽。??为了实现成批次地处理,通常对iV张输入图像进行如下的预处理:??⑴随机裁剪(random?crop)??i=iii??图2.1随机裁剪示意图??Fig.?2.1?Random?Crop??如图2.1,按一定的概率随机从原始图像中截取一张子图作为网络的输入图片。随机??截取使输入图像仅保留原始图像的局部区域,在模型的训练过程中,弱化数据的噪声,??丰富训练数据的数fi,防止过拟合现象的发生,增加了模型的稳定性。??n??图2.2随机水平翻转示意图??Fig.?2.2?Random?Horizontal?Flip??-7?-??
本文编号:3368440
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图1.2本文研究流程??Fig.?1.2?Research?Process??
?大连海事大学专业学位硕士学位论文???2特征提取网络??目前主流的目标检测模型和行人重识别模型都基于卷积神经网络。卷积神经网络的??主要功能是提取输入图像的深度语义特征,不同的视觉任务模型釆用不同的方法处理该??深度语义特征。本文将目标检测和行人重识别中使用的神经网络统一看作特征提取网??络,将深度语义特征的提取作为图像的预处理来研究。??2.1输入图像预处理??卷积神经网络可以一次性处理多个输入图像,通常称网络的输入为批数据??(minibatch)。批数据是经过预处理后的四维张瑣,大小形式为(TV?x?C?x?//?x?IV)。??其中iV表示网络一次处理iV张图像;C表示输入图像的通道数,通常输入图像是RGB??格式的彩色图像,所以C?=?3;?//和分别代表输入图像的高和宽。??为了实现成批次地处理,通常对iV张输入图像进行如下的预处理:??⑴随机裁剪(random?crop)??i=iii??图2.1随机裁剪示意图??Fig.?2.1?Random?Crop??如图2.1,按一定的概率随机从原始图像中截取一张子图作为网络的输入图片。随机??截取使输入图像仅保留原始图像的局部区域,在模型的训练过程中,弱化数据的噪声,??丰富训练数据的数fi,防止过拟合现象的发生,增加了模型的稳定性。??n??图2.2随机水平翻转示意图??Fig.?2.2?Random?Horizontal?Flip??-7?-??
?大连海事大学专业学位硕士学位论文???2特征提取网络??目前主流的目标检测模型和行人重识别模型都基于卷积神经网络。卷积神经网络的??主要功能是提取输入图像的深度语义特征,不同的视觉任务模型釆用不同的方法处理该??深度语义特征。本文将目标检测和行人重识别中使用的神经网络统一看作特征提取网??络,将深度语义特征的提取作为图像的预处理来研究。??2.1输入图像预处理??卷积神经网络可以一次性处理多个输入图像,通常称网络的输入为批数据??(minibatch)。批数据是经过预处理后的四维张瑣,大小形式为(TV?x?C?x?//?x?IV)。??其中iV表示网络一次处理iV张图像;C表示输入图像的通道数,通常输入图像是RGB??格式的彩色图像,所以C?=?3;?//和分别代表输入图像的高和宽。??为了实现成批次地处理,通常对iV张输入图像进行如下的预处理:??⑴随机裁剪(random?crop)??i=iii??图2.1随机裁剪示意图??Fig.?2.1?Random?Crop??如图2.1,按一定的概率随机从原始图像中截取一张子图作为网络的输入图片。随机??截取使输入图像仅保留原始图像的局部区域,在模型的训练过程中,弱化数据的噪声,??丰富训练数据的数fi,防止过拟合现象的发生,增加了模型的稳定性。??n??图2.2随机水平翻转示意图??Fig.?2.2?Random?Horizontal?Flip??-7?-??
本文编号:3368440
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3368440.html
最近更新
教材专著