基于卷积神经网络的道路场景分割方法研究
发布时间:2020-12-21 12:26
图像语义分割是计算机视觉中的一个重要研究课题,是场景理解的关键技术之一,它在自动驾驶、医疗图像分割、可穿戴式设备等诸多领域有着广泛的应用。传统的分割方法受限于对图像特征的提取能力,无法满足复杂场景中语义分割任务的精度要求。随着深度学习的发展,卷积神经网络开始应用到计算机视觉的诸多领域。而全卷积神经网络的出现则使深度学习中对目标的分类细化到像素级别,极大地提升了语义分割任务的精度和速度。图像语义分割应用于道路场景主要可分为两种:对图像中不同物体的分割以及更精细地对同一类物体的不同目标实现实例分割。本文中所研究的道路场景分割问题是实现对道路场景不同类别物体的多重分割,具体可分为道路、人行道、树木、建筑、行人、汽车等19类。要求在不降低检测精准度的同时,尽量加快网络的检测速度。针对以上问题,本文通过对各种神经网络结构和语义分割模型展开深入研究,提出了两种基于编码器-解码器结构的语义分割模型。这两种网络结构是对经典语义分割网络UNet的改进,具体工作和贡献如下:1、使用线性插值对图像特征矩阵上采样以降低训练难度,并通过引入1x1卷积结构平衡跳跃连接中低层特征和上采样结果的权重;2、通过引入深度...
【文章来源】:中国地质大学(北京)北京市 211工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
语义分割示例图
第2章 语义分割相关内容研究网络是受生物的神经系统启发,模仿生物神经网络的经元,神经元相互连接构建的网状模型。原始数据经最终会转化成人可以理解的有意义的信息。初期的神层与层之间的相互连接,如图 2-1 中,后一层神经元神经元相连。假设某一层神经网络具有 m 个神经元作为输入,前后层两个神经元间信息传递的公式为 要m×n个权值w,网络需要调整的参数数量将远远大计算量过大,难以训练。
之间距离的增加而减小,像素之间的距离越远,则相关性越弱。因此先通过连接获取图像的局部特征,在高层连接这些局部特征得到图像的全局信息是的;权值共享是指对图像不同位置进行局部连接时,使用相同权值的卷积值共享是基于这样的考虑:图像特征与其所在图像中的位置是无关的,因此使用相同的卷积核对全图进行扫描以获取相同的特征。如图 2-2所示,对于512×3 尺寸的图像,采用全连接操作输出每一个像素点的值需要 512×512权值 w,每一层输出矩阵则需要 512×512×512×512×3 个权值 w,这已经超出了图像原本的大小,使得网络变得难以计算;如果采用 3×3×3 的卷积提取该特征图,并采用权值共享策略,需要训练的参数则下降到了 27.可以积操作相比于全连接操作极大减少了网络训练时所需调整参数的数量,同时低了网络过拟合的概率,使网络的训练变得更为简单可行。
【参考文献】:
期刊论文
[1]改进的自适应Canny边缘检测算法[J]. 段锁林,殷聪聪,李大伟. 计算机工程与设计. 2018(06)
[2]基于分裂合并的多模型拟合方法在点云分割中的应用[J]. 张良培,张云,陈震中,肖佩珮,罗斌. 测绘学报. 2018(06)
[3]Nesterov加速梯度无人机姿态融合算法[J]. 李瑞涵,王耀南,谭建豪. 机器人. 2018(06)
[4]基于最大类间方差法和数学形态学的遥感图像潮沟提取方法[J]. 朱言江,韩震,和思海,胡旭冉,陈佩达. 上海海洋大学学报. 2017(01)
[5]改进的Roberts图像边缘检测算法[J]. 王方超,张旻,宫丽美. 探测与控制学报. 2016(02)
[6]基于Laplace算子和灰色理论的热红外影像边缘检测[J]. 夏清,陈亚凯,张振鑫,杜翔宇,王海娟,许立江. 红外技术. 2014(05)
本文编号:2929824
【文章来源】:中国地质大学(北京)北京市 211工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
语义分割示例图
第2章 语义分割相关内容研究网络是受生物的神经系统启发,模仿生物神经网络的经元,神经元相互连接构建的网状模型。原始数据经最终会转化成人可以理解的有意义的信息。初期的神层与层之间的相互连接,如图 2-1 中,后一层神经元神经元相连。假设某一层神经网络具有 m 个神经元作为输入,前后层两个神经元间信息传递的公式为 要m×n个权值w,网络需要调整的参数数量将远远大计算量过大,难以训练。
之间距离的增加而减小,像素之间的距离越远,则相关性越弱。因此先通过连接获取图像的局部特征,在高层连接这些局部特征得到图像的全局信息是的;权值共享是指对图像不同位置进行局部连接时,使用相同权值的卷积值共享是基于这样的考虑:图像特征与其所在图像中的位置是无关的,因此使用相同的卷积核对全图进行扫描以获取相同的特征。如图 2-2所示,对于512×3 尺寸的图像,采用全连接操作输出每一个像素点的值需要 512×512权值 w,每一层输出矩阵则需要 512×512×512×512×3 个权值 w,这已经超出了图像原本的大小,使得网络变得难以计算;如果采用 3×3×3 的卷积提取该特征图,并采用权值共享策略,需要训练的参数则下降到了 27.可以积操作相比于全连接操作极大减少了网络训练时所需调整参数的数量,同时低了网络过拟合的概率,使网络的训练变得更为简单可行。
【参考文献】:
期刊论文
[1]改进的自适应Canny边缘检测算法[J]. 段锁林,殷聪聪,李大伟. 计算机工程与设计. 2018(06)
[2]基于分裂合并的多模型拟合方法在点云分割中的应用[J]. 张良培,张云,陈震中,肖佩珮,罗斌. 测绘学报. 2018(06)
[3]Nesterov加速梯度无人机姿态融合算法[J]. 李瑞涵,王耀南,谭建豪. 机器人. 2018(06)
[4]基于最大类间方差法和数学形态学的遥感图像潮沟提取方法[J]. 朱言江,韩震,和思海,胡旭冉,陈佩达. 上海海洋大学学报. 2017(01)
[5]改进的Roberts图像边缘检测算法[J]. 王方超,张旻,宫丽美. 探测与控制学报. 2016(02)
[6]基于Laplace算子和灰色理论的热红外影像边缘检测[J]. 夏清,陈亚凯,张振鑫,杜翔宇,王海娟,许立江. 红外技术. 2014(05)
本文编号:2929824
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2929824.html