基于数据增强和多通道神经网络的人员搜索方法
发布时间:2024-05-30 20:52
随着公共场所下监控摄像头的普及,视频监控逐渐成为了目前公共安全管理领域的一种非常重要的应用,对于社会安全保障起着尤为重要的作用。但是目前公共场所中的监控系统通常布置有成百上千个摄像头,产生大量的视频数据,而在海量数据中通过人工进行人员搜索困难巨大。因此,本文以智能化的人员搜索为主要研究内容,针对利用图像和文本进行人员搜索的任务,分别提出了一种基于随机线性插值的行人再识别方法和一种嵌入相似性排名损失函数的人员搜索方法。在本文研究工作中,有以下三点主要贡献:(1)针对基于图像的人员搜索任务(即行人再识别)中数据规模较小,而导致行人再识别的网络模型容易产生过拟合的问题,提出了基于随机线性插值的数据增强方法。该方法在不同样本间进行线性插值以生成大量新的样本,并保持原始样本的基本特征。数据增强有利于探索有标记样本的近邻分布情况,利用先验知识监督学习来对人员个体进行更精准的识别和搜索。(2)为得到基于文本的人员搜索任务中不同模态数据间深层特征的统一表达,结合循环神经网络和卷积神经网络,提出了多通道神经网络框架以提取不同模态数据(图像和文本)在统一特征空间中的表示。(3)为进一步优化多通道神经网络框...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和研究意义
1.2 国内外研究现状
1.3 本文的主要工作
1.4 组织结构
第二章 相关工作与技术基础
2.1 图像特征学习(残差网络模型)
2.2 文本特征学习(长短时记忆单元)
2.3 基于数据增强的行人再识别方法
第三章 基于随机线性插值的行人再识别方法研究
3.1 引言
3.2 基于随机线性插值的行人再识别方法
3.3 实验设置与性能评估方法
3.3.1 数据集
3.3.2 实验设置
3.3.3 参数敏感性分析与性能评估标准
3.4 实验结果和分析
3.4.1 基准模型的对比实验
3.4.2 数据增强方法对比实验
3.4.3 行人再识别方法的对比实验
3.5 本章小结
第四章 嵌入相似性损失函数的人员搜索方法
4.1 引言
4.2 嵌入相似性的排名损失函数
4.3 嵌入相似性损失函数的多通道神经网络
4.4 实验与分析
4.4.1 数据集和评估标准
4.4.2 网络的详细参数
4.4.3 对比实验结果与分析
4.5 本章小结
总结与展望
总结
展望
参考文献
致谢
攻读硕士学位期间取得的科研成果
作者简介
本文编号:3984778
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和研究意义
1.2 国内外研究现状
1.3 本文的主要工作
1.4 组织结构
第二章 相关工作与技术基础
2.1 图像特征学习(残差网络模型)
2.2 文本特征学习(长短时记忆单元)
2.3 基于数据增强的行人再识别方法
第三章 基于随机线性插值的行人再识别方法研究
3.1 引言
3.2 基于随机线性插值的行人再识别方法
3.3 实验设置与性能评估方法
3.3.1 数据集
3.3.2 实验设置
3.3.3 参数敏感性分析与性能评估标准
3.4 实验结果和分析
3.4.1 基准模型的对比实验
3.4.2 数据增强方法对比实验
3.4.3 行人再识别方法的对比实验
3.5 本章小结
第四章 嵌入相似性损失函数的人员搜索方法
4.1 引言
4.2 嵌入相似性的排名损失函数
4.3 嵌入相似性损失函数的多通道神经网络
4.4 实验与分析
4.4.1 数据集和评估标准
4.4.2 网络的详细参数
4.4.3 对比实验结果与分析
4.5 本章小结
总结与展望
总结
展望
参考文献
致谢
攻读硕士学位期间取得的科研成果
作者简介
本文编号:3984778
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3984778.html