基于全卷积网络的图像语义分割算法研究
发布时间:2021-06-17 09:17
由于深度学习的发展以及全卷积网络的出现,图像语义分割得以快速发展,广泛应用于无人驾驶、医疗诊断、机器导航等领域。其中无人驾驶领域一直是研究热点,在该领域中对于车辆周围的环境感知是研究的重点。图像语义分割算法可以对图像进行像素级分类,从而获得图像的整体信息,且只需要低成本的视觉传感器,因此十分契合无人驾驶技术的需求。全卷积网络是一种可行的、效果较好的图像语义分割算法,该算法创新性的将卷积神经网络中的全连接层替换为卷积层,并应用于像素级分类任务中。其中Deep Lab算法是一种基于全卷积网络改进且精度较高的算法,然而该算法还是存在着一些问题,有很大的进步空间。本课题主要研究该算法的各个子模块,找出其所存在的问题并给出相应的解决方案,进一步提升算法精度。针对Deep Lab算法没有充分利用全局信息导致在复杂场景下效果较差的问题,本文引入了全局上下文信息模块,提供了图片中复杂场景的先验信息,提取全局信息与原始特征合并,提高了特征的表达能力。针对Deep Lab算法解码器模块过于简单,预测结果边界较为粗糙的问题,本文设计了一个高效的解码器模块,充分利用浅层特征,将浅层语义信息与深层语义信息相结合...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
全连接与局部连接对比
哈尔滨工业大学工程硕士学位论文所有的线性变化与非线性变换都是可导的。在网络层的最后一层一般接一失函数或者多个损失函数,不同的任务会有不同的损失函数。相对于传统网络,卷积神经网络保持了数据本身的像素之间的结构,如数据本身为三么卷积核也将是三维数据,而不是传统神经网络的向量表示。传统是神经与卷积神经网络的区别如图 2-2 所示1。
哈尔滨工业大学工程硕士学位论文 90i iif x w x (2(2)池化层如果一直使用卷积层来进行特征获取,所需要学习的参数会非常的多,候就需要一种方法来降低学习的代价。池化层又称为汇聚层,即采用下采方式,将一定邻域内的特征聚合在一起,用一个像素点的信息来代表邻域有像素点的信息,这样减少了计算量,同时也保留了大部分的有效信息。层一般有最大池化以及平均池化。最大池化层意思是将一定邻域内像素值最大的值当作该邻域的特征送一层中;同理,平均池化层意思是将一定邻域内所有像素值的平均值作为域的特征送入新一层中。而池化层是没有学习能力的,可以保持特征不变性伸缩、平移、旋转等。最大池化操作如图 2-3 所示2。
【参考文献】:
期刊论文
[1]基于DCNN的图像语义分割综述[J]. 魏云超,赵耀. 北京交通大学学报. 2016(04)
[2]无人驾驶汽车的发展现状和展望[J]. 杨帆. 上海汽车. 2014(03)
[3]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
本文编号:3234918
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
全连接与局部连接对比
哈尔滨工业大学工程硕士学位论文所有的线性变化与非线性变换都是可导的。在网络层的最后一层一般接一失函数或者多个损失函数,不同的任务会有不同的损失函数。相对于传统网络,卷积神经网络保持了数据本身的像素之间的结构,如数据本身为三么卷积核也将是三维数据,而不是传统神经网络的向量表示。传统是神经与卷积神经网络的区别如图 2-2 所示1。
哈尔滨工业大学工程硕士学位论文 90i iif x w x (2(2)池化层如果一直使用卷积层来进行特征获取,所需要学习的参数会非常的多,候就需要一种方法来降低学习的代价。池化层又称为汇聚层,即采用下采方式,将一定邻域内的特征聚合在一起,用一个像素点的信息来代表邻域有像素点的信息,这样减少了计算量,同时也保留了大部分的有效信息。层一般有最大池化以及平均池化。最大池化层意思是将一定邻域内像素值最大的值当作该邻域的特征送一层中;同理,平均池化层意思是将一定邻域内所有像素值的平均值作为域的特征送入新一层中。而池化层是没有学习能力的,可以保持特征不变性伸缩、平移、旋转等。最大池化操作如图 2-3 所示2。
【参考文献】:
期刊论文
[1]基于DCNN的图像语义分割综述[J]. 魏云超,赵耀. 北京交通大学学报. 2016(04)
[2]无人驾驶汽车的发展现状和展望[J]. 杨帆. 上海汽车. 2014(03)
[3]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
本文编号:3234918
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3234918.html