基于迁移学习的行人重识别技术研究

发布时间：2021-01-20 12:54

　　行人重识别这一课题指的是在时间、空间非重叠的监控数据中,检索某一段监控数据中出现的某一个目标人物是否也在其他的监控数据中出现。最近的几年,行人重识别问题引起了深度学习领域的广大科研人员的兴趣,纷纷在这一领域投入大量精力进行研究,并提出了许多优秀的算法。视频监控中的拍摄图像常常具有分辨率低、光照变化较为剧烈、摄像设备视角变化较大、行人的动作和姿态多变等常见问题,这会导致同一行人在不同的视频中具有很大的差异,给行人重识别课题增加了巨大的挑战。此外,学术界中行人重识别任务的视频数据集基本只含有几百个或者一千个左右的行人数据,这对于训练一个效果较好的多帧图像行人重识别深度网络模型是不足够的,不利于神经网络模型分类效果的提高。本篇论文立足于来解决基于视频序列的行人重识别任务,在算法中首先利用卷积神经网络（CNN）和循环神经网络（RNN）设计了一种将序列数据用来训练的深度神经网络。之后以这个深度神经网络作为基础,通过迁移学习的方法提高网络训练的效果,用来解决因训练数据不足而对网络训练造成的不良影响。具体采用的迁移学习方式有两种:基于预训练方式的迁移学习方法以及使用了跨模态对齐模块的迁移学习。本文先...

【文章来源】：上海交通大学上海市 211工程院校 985工程院校教育部直属院校

【文章页数】：86 页

【学位级别】：硕士

【部分图文】：

基于迁移学习的行人重识别技术研究

–1iLIDS-VID行人重识别数据库样例图

行人,数据库,测试集,训练集

非常具有挑战性。我们将 600 个行人及其对应的序列化图像数据分为 2 个集合：训练集和测试集。训练集和测试集的行人数量相同，即训练集包含 300 个行人对象，测试集包含 300 个行人对象。iLIDS-VID 的数据库中的样例图如图2–1所示。图 2–2 PRID 200 行人重识别数据库样例图Fig 2–2 The example images of PRID 2011 person re-identification dataset2.2.2 PRID 200 数据库PRID 2011 数据集由从两个位置不同的监视摄像机记录的行人轨迹中提取的图像组成 [30]。来自这些摄像机的拍摄图像包含了拍摄视角的变化以及和光照、背景内容相关— 9 —

行人,数据库,序列化,测试集

长度长于 21 的行人数据。共有 200 个行人的数据包含在内。我们将 200 个行人及其对应的序列化图像数据分为 2 个集合：训练集和测试集。训练数据集和测试数据集的行人数量相同，分别包含 100 个行人对象。PRID 200 数据库的样例图片如图2–2所示。— 10 —

【参考文献】：
期刊论文
[1]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航.  计算机应用. 2016(09)
[2]结合全局词向量特征的循环神经网络语言模型[J]. 李华,屈丹,张文林,王炳锡,梁玉龙.  信号处理. 2016(06)
[3]深度学习的研究与发展[J]. 张建明,詹智财,成科扬,詹永照.  江苏大学学报(自然科学版). 2015(02)
[4]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟.  计算机研究与发展. 2013(09)
[5]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正.  计算机应用研究. 2012(08)

本文编号：2989082

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2989082.html

上一篇：真空自耗电弧炉控制系统改造设计与实现
下一篇：机械臂碰撞检测与响应策略及柔顺控制算法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|