基于深度学习的视频镜头检测与对象分割
发布时间:2020-12-27 20:49
在大数据时代,越来越多的视频数据等待着被处理、分析和挖掘。然而,很多视频在产生时并没有进行有效的标注甚至没有标注,这给人们搜索并处理他们感兴趣的视频部分带来了极大的挑战,因而开发一套高效的视频结构化分析技术是很有必要的。其中,视频镜头检测技术和视频对象分割技术是实现视频结构化分析的基础和关键步骤。针对视频镜头检测本文做了如下贡献:提出了一个高效的视频镜头检测框架,指出高效的模型中应必备的三个要素(预处理,特征提取和检测算法),并给出了相应的设计建议。根据提出的框架本文进一步实现了基于深度学习的视频镜头检测算法。算法思路如下:首先应用框架内详细介绍的基于二分比较的方法对给定视频进行预处理,滤除大量的非镜头帧并得到可能包含镜头边界的候选段。然后使用AlexNet对每段提取深度特征,通过分析、筛选得到具有强表达能力的fc-6特征对候选段内的帧进行高效表征。最后分别针对突变边界、渐变边界候选段应用相应的检测算法:对于突变边界检测,本文综合考虑了段内平均相似度和连续帧间相似度的关系并定义了相似度“显著”改变的标准,进而能够精确检测得到突变边界的位置;对于渐变边界检测,本文通过对渐变边界的分析得到...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:92 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题研究背景和意义
1.2 课题研究现状
1.2.1 视频镜头检测算法研究现状
1.2.2 视频对象分割算法研究现状
1.3 本文的研究点
1.4 本文主要工作及章节安排
第二章 深度学习基础
2.1 有监督学习
2.2 最优化算法
2.3 反向传播算法
2.4 神经网络
2.4.1 BP神经网络
2.4.2 卷积神经网络
第三章 视频镜头检测
3.1 高效的视频镜头检测框架
3.1.1 预处理
3.1.2 特征提取
3.1.3 检测算法
3.2 视频镜头检测算法的发展综述
3.3 基于深度学习的视频镜头检测算法
3.3.1 深度特征分析
3.3.2 基于深度特征的检测算法
3.4 实验部分
第四章 视频对象分割
4.1 视频对象分割领域的代表算法
4.1.1 无监督算法和半监督算法
4.1.2 深度学习应用于视频对象分割的挑战
4.2 基于双流深度编码-解码网络的对象分割算法
4.2.1 编码结构
4.2.2 解码结构
4.2.3 融合结构
4.2.4 训练过程
4.3 实验部分
第五章 总结与展望
5.1 全文工作总结
5.2 研究展望
参考文献
致谢
攻读学位期间发表的学术论文
攻读学位期间申请的发明专利
本文编号:2942461
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:92 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题研究背景和意义
1.2 课题研究现状
1.2.1 视频镜头检测算法研究现状
1.2.2 视频对象分割算法研究现状
1.3 本文的研究点
1.4 本文主要工作及章节安排
第二章 深度学习基础
2.1 有监督学习
2.2 最优化算法
2.3 反向传播算法
2.4 神经网络
2.4.1 BP神经网络
2.4.2 卷积神经网络
第三章 视频镜头检测
3.1 高效的视频镜头检测框架
3.1.1 预处理
3.1.2 特征提取
3.1.3 检测算法
3.2 视频镜头检测算法的发展综述
3.3 基于深度学习的视频镜头检测算法
3.3.1 深度特征分析
3.3.2 基于深度特征的检测算法
3.4 实验部分
第四章 视频对象分割
4.1 视频对象分割领域的代表算法
4.1.1 无监督算法和半监督算法
4.1.2 深度学习应用于视频对象分割的挑战
4.2 基于双流深度编码-解码网络的对象分割算法
4.2.1 编码结构
4.2.2 解码结构
4.2.3 融合结构
4.2.4 训练过程
4.3 实验部分
第五章 总结与展望
5.1 全文工作总结
5.2 研究展望
参考文献
致谢
攻读学位期间发表的学术论文
攻读学位期间申请的发明专利
本文编号:2942461
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2942461.html