基于深度卷积神经网络的视频语义分割方法研究
发布时间:2021-04-26 22:25
目前,自动驾驶领域在可行性和实用化方面都取得了突破性的进展,其对于汽车行业甚至是交通运输业有着深远的影响。那么针对图像的语义分割算法可以对图像中的目标进行像素级的高精度分类,在自动驾驶中,通过对图像的语义分割可以获取道路可行驶区域的信息,检测车道标记和交通信息等。图像语义分割是计算机视觉领域中重要的任务之一,进一步的提高其分割精度和处理速度是在实际应用中需要解决的问题。通常情况下利用视觉传感器获取的视频的数据量庞大,并且对视频处理过程的效率要求较高,而传统的图像处理方法难以满足视频分割的处理速度,且分割的精准度较低。基于此,本文基于深度卷积神经网络,分别设计了改进的U形网络和W形网络,并且利用光流场对帧与帧之间的特征进行传播和融合,使得整个方法在尽可能的保持精细的分割精度的前提下,大幅度降低实时的视频语义分割处理时间。论文的主要内容包括:首先本文基于编码器-解码器结构,设计了U形-S-A网络结构,该网络结构利用深度可分离卷积结构和通道注意力模型分别去除网络特征图中空间和通道的相关性,使得分类精度得到进一步的提升。接下来为了进一步的降低分割的处理时间,本文还设计了基于ResNet网络和X...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 国内外在该方向的研究现状及分析
1.2.1 卷积神经网络发展历史和现状
1.2.2 基于卷积神经网络的图像语义分割研究现状
1.2.3 基于卷积神经网络的视频语义分割研究现状
1.3 本文的主要研究内容及章节安排
第2章 基于U形网络的视频语义分割模型研究
2.1 引言
2.2 基础理论及方法介绍
2.2.1 深度卷积神经网络介绍
2.2.2 图像语义分割算法介绍
2.2.3 视频语义分割算法介绍
2.3 基于U形网络的视频语义分割方法研究
2.3.1 深度可分离卷积神经网络原理分析
2.3.2 通道注意力机制结构原理分析
2.3.3 实验改进U形网络总体框架及分析
2.4 模型实验结果及分析
2.4.1 实验数据集介绍
2.4.2 实验结果对比展示分析
2.5 本章小结
第3章 基于W形网络的视频语义分割模型研究
3.1 引言
3.2 W形网络原理介绍分析
3.2.1 ResNet网络结构研究分析
3.2.2 Xception网络结构研究及分析
3.2.3 实验改进W形网络结构总体框架及分析
3.3 基于W形网络的视频语义分割实验结果分析
3.3.1 实验结果对比分析
3.3.2 分割图像可视化
3.4 本章小结
第4章 融合光流场特征聚合的W形网络视频语义分割算法应用
4.1 引言
4.2 光流场特征聚合算法介绍
4.2.1 光流场原理研究分析
4.2.2 光流场特征聚合框架分析介绍
4.3 融合光流场特征聚合的W形网络算法分析
4.4 分类实验结果及分析
4.4.1 实验结果对比分析
4.4.2 分割图像可视化
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
【参考文献】:
期刊论文
[1]深层网络中的梯度消失现象[J]. 周祥全,张津. 科技展望. 2017(27)
[2]基于DCNN的图像语义分割综述[J]. 魏云超,赵耀. 北京交通大学学报. 2016(04)
[3]图像理解中的卷积神经网络[J]. 常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安. 自动化学报. 2016(09)
[4]无人驾驶汽车的发展现状和展望[J]. 杨帆. 上海汽车. 2014(03)
[5]基于双线性插值的图像缩放算法的研究与实现[J]. 王森,杨克俭. 自动化技术与应用. 2008(07)
本文编号:3162229
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 国内外在该方向的研究现状及分析
1.2.1 卷积神经网络发展历史和现状
1.2.2 基于卷积神经网络的图像语义分割研究现状
1.2.3 基于卷积神经网络的视频语义分割研究现状
1.3 本文的主要研究内容及章节安排
第2章 基于U形网络的视频语义分割模型研究
2.1 引言
2.2 基础理论及方法介绍
2.2.1 深度卷积神经网络介绍
2.2.2 图像语义分割算法介绍
2.2.3 视频语义分割算法介绍
2.3 基于U形网络的视频语义分割方法研究
2.3.1 深度可分离卷积神经网络原理分析
2.3.2 通道注意力机制结构原理分析
2.3.3 实验改进U形网络总体框架及分析
2.4 模型实验结果及分析
2.4.1 实验数据集介绍
2.4.2 实验结果对比展示分析
2.5 本章小结
第3章 基于W形网络的视频语义分割模型研究
3.1 引言
3.2 W形网络原理介绍分析
3.2.1 ResNet网络结构研究分析
3.2.2 Xception网络结构研究及分析
3.2.3 实验改进W形网络结构总体框架及分析
3.3 基于W形网络的视频语义分割实验结果分析
3.3.1 实验结果对比分析
3.3.2 分割图像可视化
3.4 本章小结
第4章 融合光流场特征聚合的W形网络视频语义分割算法应用
4.1 引言
4.2 光流场特征聚合算法介绍
4.2.1 光流场原理研究分析
4.2.2 光流场特征聚合框架分析介绍
4.3 融合光流场特征聚合的W形网络算法分析
4.4 分类实验结果及分析
4.4.1 实验结果对比分析
4.4.2 分割图像可视化
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
【参考文献】:
期刊论文
[1]深层网络中的梯度消失现象[J]. 周祥全,张津. 科技展望. 2017(27)
[2]基于DCNN的图像语义分割综述[J]. 魏云超,赵耀. 北京交通大学学报. 2016(04)
[3]图像理解中的卷积神经网络[J]. 常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安. 自动化学报. 2016(09)
[4]无人驾驶汽车的发展现状和展望[J]. 杨帆. 上海汽车. 2014(03)
[5]基于双线性插值的图像缩放算法的研究与实现[J]. 王森,杨克俭. 自动化技术与应用. 2008(07)
本文编号:3162229
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3162229.html