基于编解码网络和特征编码的图像语义分割方法研究
发布时间:2022-01-14 19:42
语义分割是计算机视觉中最基本的任务之一,对图像理解起着关键作用,并且在许多实际应用中有重大影响,例如自动驾驶、机器人和医疗图像诊断等。近年来,虽然基于深度卷积神经网络的语义分割研究取得了显著进步,但还是存在不少挑战。本文基于深度学习技术,从两个方面研究了基于深度卷积网络的语义分割模型,分别是通过融合上下文语义信息和空间信息提高语义分割准确度的研究,以及通过弹性特征金字塔模块减少语义分割的时间复杂度、达到实时语义分割的研究。本文所做工作具体阐述如下:首先,本文对当前基于深度学习的语义分割算法展开详细地概述,细致地介绍了图像语义分割常用的深度模型框架。接着,按照提升网络感受域的方法、基于特征融合的方法、基于注意力机制的方法和基于神经网络架构搜索的方法这四个维度,对当前最有效的语义分割方法进行论述。最后阐述了未来最有前景的实时语义分割方法。通过对当前语义分割方法进行回顾,能够清晰地了解语义分割研究的发展历程,以及为相关的研究人员启发研究思路。其次,当前图像语义分割研究基本围绕如何提取有效的语义上下文信息和还原空间细节信息两个因素来设计更高效算法。为了提升网络的语义表达能力,同时建立像素点之间...
【文章来源】:江西理工大学江西省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及其意义
1.2 语义分割研究现状
1.3 语义分割研究难点
1.4 研究的主要内容
1.5 本文的组织结构
第二章 基于深度学习的图像语义分割进展综述
2.1 引言
2.2 语义分割基本网络框架
2.2.1 全卷积网络结构
2.2.2 编解码结构
2.2.3 基于循环神经网络结构
2.2.4 基于对抗网络结构
2.3 提升网络感受域的语义分割方法
2.4 基于特征融合的语义分割方法
2.4.1 多尺度特征融合
2.4.2 不同层级特征融合
2.5 基于注意力机制的语义分割方法
2.6 基于神经网络结构搜索的语义分割方法
2.7 实时语义分割方法
2.7.1 基于轻量化卷积结构
2.7.2 多分支结构
2.8 本章小结
第三章 基于上下文和浅层空间编解码网络的图像语义分割方法
3.1 引言
3.2 相关工作
3.2.1 编码器-解码器
3.2.2 二分支结构
3.2.3 空间金字塔
3.3 本文所提出的方法
3.3.1 网络结构
3.3.2 混合扩张卷积模块
3.3.3 残差金字塔特征提取模块
3.3.4 链式反置残差模块
3.3.5 残差循环卷积模块
3.4 实验
3.4.1 实验设置
3.4.2 Cam Vid数据集上的结果
3.4.3 SUN RGB-D数据集上的结果
3.4.4 Cityscapes数据集上的结果
3.4.5 消融实验
3.5 本章小结
第四章 基于特征编码融合网络的实时语义分割
4.1 引言
4.2 相关工作
4.2.1 实时语义分割
4.2.2 多尺度特征融合
4.2.3 不同层级特征融合
4.3 所提出的方法
4.3.1 弹性特征金字塔模块
4.3.2 多路径语义模块
4.3.3 双注意力融合模块
4.3.4 网络结构
4.4 实验
4.4.1 实验设置
4.4.2 Cam Vid数据集上的结果
4.4.3 Cityscapes数据集上的结果
4.4.4 消融实验
4.5 本章小结
第五章 总结与展望
5.1 本文工作总结
5.2 研究展望
参考文献
致谢
攻读学位期间的研究成果
本文编号:3589096
【文章来源】:江西理工大学江西省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及其意义
1.2 语义分割研究现状
1.3 语义分割研究难点
1.4 研究的主要内容
1.5 本文的组织结构
第二章 基于深度学习的图像语义分割进展综述
2.1 引言
2.2 语义分割基本网络框架
2.2.1 全卷积网络结构
2.2.2 编解码结构
2.2.3 基于循环神经网络结构
2.2.4 基于对抗网络结构
2.3 提升网络感受域的语义分割方法
2.4 基于特征融合的语义分割方法
2.4.1 多尺度特征融合
2.4.2 不同层级特征融合
2.5 基于注意力机制的语义分割方法
2.6 基于神经网络结构搜索的语义分割方法
2.7 实时语义分割方法
2.7.1 基于轻量化卷积结构
2.7.2 多分支结构
2.8 本章小结
第三章 基于上下文和浅层空间编解码网络的图像语义分割方法
3.1 引言
3.2 相关工作
3.2.1 编码器-解码器
3.2.2 二分支结构
3.2.3 空间金字塔
3.3 本文所提出的方法
3.3.1 网络结构
3.3.2 混合扩张卷积模块
3.3.3 残差金字塔特征提取模块
3.3.4 链式反置残差模块
3.3.5 残差循环卷积模块
3.4 实验
3.4.1 实验设置
3.4.2 Cam Vid数据集上的结果
3.4.3 SUN RGB-D数据集上的结果
3.4.4 Cityscapes数据集上的结果
3.4.5 消融实验
3.5 本章小结
第四章 基于特征编码融合网络的实时语义分割
4.1 引言
4.2 相关工作
4.2.1 实时语义分割
4.2.2 多尺度特征融合
4.2.3 不同层级特征融合
4.3 所提出的方法
4.3.1 弹性特征金字塔模块
4.3.2 多路径语义模块
4.3.3 双注意力融合模块
4.3.4 网络结构
4.4 实验
4.4.1 实验设置
4.4.2 Cam Vid数据集上的结果
4.4.3 Cityscapes数据集上的结果
4.4.4 消融实验
4.5 本章小结
第五章 总结与展望
5.1 本文工作总结
5.2 研究展望
参考文献
致谢
攻读学位期间的研究成果
本文编号:3589096
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3589096.html