面向无人机视觉的图像语义分割技术研究
发布时间:2022-02-10 10:24
随着通信技术、计算机硬件技术近年来的快速发展,无人机由于其体积小、灵活性高、适应力强等优点,无论是在军用的侦察、攻击、预警领域,还是在民用的交通、气象、农业、救灾、娱乐等领域都有了广泛的应用。在无人机自主飞行时,需要自动完成导航、避障、定位等;在救灾现场使用无人机进行侦察时,需要迅速对灾情进行判断然后再做决策;在无人机自动落地时,需要精准地找到落地点;这些都需要依靠无人机视觉来实现自动环境感知。因此如何在复杂场景下高效准确地实现环境感知是无人机视觉领域的技术热点。当前飞速发展的深度学习技术为无人机环境感知提供了良好的解决方案,使用像素级的图像语义分割技术为使得无人机自主图像理解成为可能。但是现有的图像语义分割算法通常致力于提升精度,在实时性方面表现并不好,无法直接适用于无人机环境感知场景。本文重点针对上述问题,面向复杂场景下的无人机视觉开展了基于深度学习的高效实时图像语义分割算法研究。设计了算法流程,构建了分模块的网络结构。基准网络部分针对精度较低问题引入残差结构来加深网络层数、引入空洞卷积来增大感受野,同时使用深度可分离卷积替代普通卷积来分离通道降低计算量从而解决实时性问题。特征增强...
【文章来源】:哈尔滨工业大学黑龙江省211工程院校985工程院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
全连接(上)和局部连接(下)
哈尔滨工业大学工程硕士学位论文-10-向、纵向的边缘,或者颜色特征等,而对于相同两层之间的卷积计算,虽然由于局部连接机制不同位置独立计算,但是可以使用一样的卷积和来完成运算,这样同层可以提取到同样的特征,通过卷积核的共用大大减少了参数量,也提升了学习时的效率。卷积神经网络的组件和感受野卷积神经网络通常由卷积层、激活层、池化层和全连接层组成。这些层级结构通过正向传播和反向传播构成了完整的CNN模型,以下将对这几个部分进行分别讲解。(1)卷积层卷积层是CNN结构中最基本、最核心的单元,因为它完成了计算机视觉任务中最为重要的特征提取的部分。在信号领域的线性系统中的卷积运算描述了输入信号在脉冲响应下的输出信号,图像领域中的卷积也是类似的操作,其运算如图2-2所示。图2-2卷积操作示意图这是一个输入为5×5的图像,对其使用一个3×3的卷积核,卷积核在9个点的权值为步长为2,通道数为1,不使用填充操作,就可以得到一张2×2的输出特征图,其中每个点的卷积运算如式(2-1)所示。(2-1)其中,表示在卷积核覆盖内的输入图像在该点的像素值,则表示经过该卷积运算,在该点得到的最终特征值。步长为2意为着卷积操作在进行滑动窗卷积时,每次移动的步长为2。通道数表示卷积核的个数,及滤波器的个数,使用多个通道数可以在一次卷积层操作后提取不同类型的特征,提高体特征的效率。在实际使用中,边界在多层卷积后信息逐渐丢失,通常会在图像中加入填充操作,对于步长为1的卷积操作,引入填充操作可以保证经过一层卷积后
哈尔滨工业大学工程硕士学位论文-11-获得相同尺度的特征图。(2)池化层卷积层通过卷积操作可以得到大量的特征,假如一直使用卷积层来连接不同层的神经元,那会由于特征图的尺度很大造成计算量很大而且特征冗余的问题,针对这一问题池化层就是很好的解决方案。图2-3最大池化操作示意图图2-3是一个最大池化的示意图,输入是一个4×4的特征图像,对其进行步长为2,尺度为2的最大池化操作,得到一个输出为2×2的特征图,对于输出的每一点,其运算过程如式(2-2)。(2-2)其中,表示该点池化时所覆盖的原特征图像素值。池化方式还有均值池化、中值池化等。池化操作能够实现下采样的目的,如图2-2中,经过池化操作特征图尺寸减半,减小的幅度由池化的步长和模板的尺度共同决定。经过池化层后,特征冗余被减弱,而且削弱了特征的位置性,使得不同位置的特征经过池化操作都可以出现在特征图中,增强了网络的鲁棒性和泛化能力。(3)全连接层全连接层顾名思义就是将上层神经元与该层全部相连,不同于卷积层参数数量取决于卷积核的大小,全连接层的参数数量由上层决定,通常位于分类任务最后的层级,来完成对前序特征的全部整合,以经过最后的判定得到输出结果。其结构如图2-4所示。但是对于含有全连接层的网络,该层的参数几乎占据了整个网络的参数量,通常为了考虑网络的性能都会进行选择性替代,例如卷积层,但是在精度上也会有一定的损失。图2-4全连接层结构示意图
【参考文献】:
期刊论文
[1]无人机视觉导航研究综述[J]. 吴显亮,石宗英,钟宜生. 系统仿真学报. 2010(S1)
本文编号:3618733
【文章来源】:哈尔滨工业大学黑龙江省211工程院校985工程院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
全连接(上)和局部连接(下)
哈尔滨工业大学工程硕士学位论文-10-向、纵向的边缘,或者颜色特征等,而对于相同两层之间的卷积计算,虽然由于局部连接机制不同位置独立计算,但是可以使用一样的卷积和来完成运算,这样同层可以提取到同样的特征,通过卷积核的共用大大减少了参数量,也提升了学习时的效率。卷积神经网络的组件和感受野卷积神经网络通常由卷积层、激活层、池化层和全连接层组成。这些层级结构通过正向传播和反向传播构成了完整的CNN模型,以下将对这几个部分进行分别讲解。(1)卷积层卷积层是CNN结构中最基本、最核心的单元,因为它完成了计算机视觉任务中最为重要的特征提取的部分。在信号领域的线性系统中的卷积运算描述了输入信号在脉冲响应下的输出信号,图像领域中的卷积也是类似的操作,其运算如图2-2所示。图2-2卷积操作示意图这是一个输入为5×5的图像,对其使用一个3×3的卷积核,卷积核在9个点的权值为步长为2,通道数为1,不使用填充操作,就可以得到一张2×2的输出特征图,其中每个点的卷积运算如式(2-1)所示。(2-1)其中,表示在卷积核覆盖内的输入图像在该点的像素值,则表示经过该卷积运算,在该点得到的最终特征值。步长为2意为着卷积操作在进行滑动窗卷积时,每次移动的步长为2。通道数表示卷积核的个数,及滤波器的个数,使用多个通道数可以在一次卷积层操作后提取不同类型的特征,提高体特征的效率。在实际使用中,边界在多层卷积后信息逐渐丢失,通常会在图像中加入填充操作,对于步长为1的卷积操作,引入填充操作可以保证经过一层卷积后
哈尔滨工业大学工程硕士学位论文-11-获得相同尺度的特征图。(2)池化层卷积层通过卷积操作可以得到大量的特征,假如一直使用卷积层来连接不同层的神经元,那会由于特征图的尺度很大造成计算量很大而且特征冗余的问题,针对这一问题池化层就是很好的解决方案。图2-3最大池化操作示意图图2-3是一个最大池化的示意图,输入是一个4×4的特征图像,对其进行步长为2,尺度为2的最大池化操作,得到一个输出为2×2的特征图,对于输出的每一点,其运算过程如式(2-2)。(2-2)其中,表示该点池化时所覆盖的原特征图像素值。池化方式还有均值池化、中值池化等。池化操作能够实现下采样的目的,如图2-2中,经过池化操作特征图尺寸减半,减小的幅度由池化的步长和模板的尺度共同决定。经过池化层后,特征冗余被减弱,而且削弱了特征的位置性,使得不同位置的特征经过池化操作都可以出现在特征图中,增强了网络的鲁棒性和泛化能力。(3)全连接层全连接层顾名思义就是将上层神经元与该层全部相连,不同于卷积层参数数量取决于卷积核的大小,全连接层的参数数量由上层决定,通常位于分类任务最后的层级,来完成对前序特征的全部整合,以经过最后的判定得到输出结果。其结构如图2-4所示。但是对于含有全连接层的网络,该层的参数几乎占据了整个网络的参数量,通常为了考虑网络的性能都会进行选择性替代,例如卷积层,但是在精度上也会有一定的损失。图2-4全连接层结构示意图
【参考文献】:
期刊论文
[1]无人机视觉导航研究综述[J]. 吴显亮,石宗英,钟宜生. 系统仿真学报. 2010(S1)
本文编号:3618733
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3618733.html