基于深度学习的视频跟踪技术研究
发布时间:2021-03-25 12:07
如今,作为智能监控的关键技术,视频跟踪受到了越来越多的学者和企业的关注。视频跟踪是计算机视觉领域的核心课题之一,融合了图像处理、模式识别、计算机控制以及人工智能等领域中的先进技术和核心思想。其在视频序列初始帧时自动或手动标记目标,获取相关信息,在后续帧中对运动目标进行实时和精确的跟踪。然而,现实场景的复杂,如遮挡、形变、光照变化等给视频跟踪技术带来了很大的困难和挑战。经过多年的发展,学者们提出了许多有效的视频跟踪算法,在一定程度上解决了复杂场景的问题。但传统的视频跟踪算法是基于人工提取的特征,大部分只针对特定的目标和场景,泛化能力差,鲁棒性不强,无法满足智能监控的要求。而深度学习的引入大大促进了视频跟踪技术的发展。本文在研究主流视频跟踪技术和深度学习原理及其应用的基础上,分析了各算法在不同场景下的表现效果,针对基于深度学习的视频跟踪技术进行了深入的研究,比较了目前该领域各算法的优缺点,并结合主流的视频跟踪框架,提出了一种基于深度卷积神经网络的视频跟踪方法。首先,基于深度学习框架caffe,利用数万张通用数据集对网络进行离线预训练,得到深度网络模型。接着,通过在线的方式训练目标与背景的分类器。之后,采用粒子滤波的方法对目标进行在线跟踪。本方法将深度学习模型和主流目标跟踪框架进行了深度的结合,充分利用深度模型强大的特征表达能力,在复杂场景如遮挡、形变、光照变化的视频序列中展现出了不错的跟踪性能,具有较好的鲁棒性和准确度。
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP181
本文编号:1917423
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP181
文章目录
摘要
Abstract
第1章 绪论
1.1 选题背景及意义
1.2 国内外研究现状
1.3 本文的主要工作及内容安排
第2章 视频跟踪技术
2.1 算法原理及分类
2.1.1 运动模型
2.1.2 特征提取
2.1.3 表征模型
2.1.4 更新预测
2.2 主流算法及存在的问题
2.2.1 主流跟踪算法
2.2.2 存在的问题和难点分析
2.3 本章小结
第3章 深度学习算法
3.1 深度学习简介
3.2 深度学习的主要模型
3.2.1 深度置信网络
3.2.2 堆栈自编码器
3.2.3 深度卷积神经网络
3.3 本章小结
第4章 深度学习在视频跟踪技术上的应用分析
4.1 基于SAE的视频跟踪算法
4.2 基于CNN的视频跟踪算法
4.2.1 只采用CNN的算法
4.2.2 结合传统跟踪算法
4.3 本章小结
第5章 基于卷积神经网络的视频跟踪技术
5.1 算法总流程
5.2 粒子滤波框架
5.3 深度学习模型
5.3.1 模型选择与结构分析
5.3.2 模型训练
5.3.3 特征提取
5.4 支持向量机
5.5 尺度空间方法
5.5.1 目标显著图
5.5.2 Lindeberg尺度空间理论
5.6 算法实现
5.7 实验结果与分析
5.7.1 实验配置
5.7.2 跟踪效果分析
5.7.3 与传统跟踪算法的比较
5.8 本章小结
第6章 总结与展望
6.1 本文总结
6.2 研究展望
参考文献
攻读硕士学位期间发表的论文及其他成果
致谢
【参考文献】
相关期刊论文 前3条
1 刘少华;张茂军;熊志辉;陈旺;;一种鲁棒高效的视频运动目标检测与跟踪算法[J];自动化学报;2009年08期
2 侯志强;韩崇昭;;视觉跟踪技术综述[J];自动化学报;2006年04期
3 田原,谭铁牛,孙洪赞;一种具有良好鲁棒性的实时跟踪方法[J];自动化学报;2002年05期
相关硕士学位论文 前1条
1 王华华;基于统计学习的人脸识别方法研究[D];上海交通大学;2007年
本文编号:1917423
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1917423.html