面向UAS场景图像分割的深度学习算法研究与应用
发布时间:2020-12-25 15:33
无人自主系统(UAS)是无人车、无人机等无人自主设备在移动场景中执行任务的重要的支撑系统。图像分割是这类UAS系统环境感知、路径规划和任务执行的关键前提。因此,面向UAS场景的图像分割相关技术研究具有十分重要的理论意义和应用价值。本文针对车载和机载应用场景,提出了一种基于深度学习的实时图像分割方法,设计并实现了应用于UAS自然场景的图像分割系统。主要工作如下:(1)针对UAS的自然场景的道路和天空分割问题,构建了自然场景图像的数据集。并采用Labelme技术对自然场景图像中的道路和天空进行标注,建立了适合本文方案的语义标签。(2)针对UAS的自然场景图像的特点和网络通畅情况,提出了一种以深度学习为基础的图像分割算法。具体由云端远程图像分割算法和智能移动终端图像分割算法构成。云端远程图像分割算法采用Kitti Seg数据集训练FCN8-VGG16网络架构。实验仿真结果表明,其F1值相对Marvin Techmann提升了4%以上,该算法可有效对道路、天空这两类的自然场景进行图像分割。在移动端采用U-Net网络架构,实现智能移动终端的图像分割算法。实验仿真结果表明,该方法的数据集图像分割的...
【文章来源】:河南大学河南省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
全卷积神经网络原理图
面向UAS场景图像分割的深度学习算法研究与应用18运用比较多的CNN模型,VGG16的模型图如图3-1所示。从图中可以看出VGG16处理图像的优良性,但平时的CNN方法需要花费更多的时间和精力对原本的处理结果进行再度处理,VGG16对处理图像更加细节便利,还不浪费时间。因此,本论文选择VGG16来进行研究分析。VGG16网络由于其优良的计算特性在复杂不容易解决的神经网络中进行图像处理。它在大规模视觉识别挑战赛中获得了最优秀的分类性能奖。VGG16包括16个权重层(由卷积层构成)和5个最大池化层(池化窗口2×2,池化步长为1)。最大池化层把13层卷积层变成5个区域,第1和第2区域都有2个卷积层,第3到第5区域各自有3个卷积层。每个区域里面卷积层的核通道数都一样,网络层的深浅决定了通道数的多少。第4和第5区域通道数比较多,分别高达256和512个,但是第2区域和第3区域的通道数比较少,分别只有64和128个。这说明了卷积层网络越深,通道数量越多。VGG16网络有3×3的卷积核,且卷积步长为1,池化层把经过卷积层处理后的图像进行再处理,降采样仅仅变成原来的二分之一。16个权重层里还有3层全连接层,它们位于13层卷积层和所有最大池化层之后,均有各自明确的分工。其中前2层功能相当于图像抽象特征,第3层功能为整理类别。神经元个数不是固定不变的,它的多少跟数据的分类数量有关,文献[54]中的神经元个数为1000,而且VGG16网络中还可以通过Softmax激活函数将结果进行再处理。VGG用它优良的性能证明了网络深浅对算法有不可磨灭的影响。由于不同数量相同尺寸大小的卷积层堆叠出来的感受野不同,为了达到保持感受野大小不变的效果,可以让几个小尺寸卷积层堆叠起来。图3-1VGG16模型图
TernausNet[59]模型也是一种编码器-解码器体系结构,它使用 VGG 网络,包含 11 个顺序层作为其编码器。实验结果表明,在 ImageNet 上预先训练的 VGG 网络达到了提高U-Net 网络性能的目的,具有相对较好的图像分割性能。这三种(FCN8、FCN32、SegNet)利用具有不同连续层数的 VGG 网络,说明了 VGG 网络结构层次。 3.2.2 KittiSeg 数据集 本文在进行数据集的标注时采用的软件是 Labelme,用 Labelme 技术对 KittiSeg 数据集和 CamVid 数据集进行标注。Labelme 是麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发的图像标注工具。
【参考文献】:
期刊论文
[1]美国防部《无人系统综合路线图》分析[J]. 王杰东,刘北,董强健. 飞航导弹. 2019(05)
[2]基于全卷积神经网络与条件随机场的车道识别方法[J]. 叶子豪,孙锐,王慧慧. 光电工程. 2019(02)
[3]云计算与信息资源共享管理机制[J]. 钟瑛. 电子技术与软件工程. 2019(02)
[4]基于TensorFlow的移动终端图像识别方法[J]. 熊亚蒙. 无线互联科技. 2018(21)
[5]组合全卷积神经网络和条件随机场的道路分割[J]. 宋青松,张超,陈禹,王兴莉,杨小军. 清华大学学报(自然科学版). 2018(08)
[6]智能无人自主系统发展趋势(英文)[J]. Tao ZHANG,Qing LI,Chang-shui ZHANG,Hua-wei LIANG,Ping LI,Tian-miao WANG,Shuo LI,Yun-long ZHU,Cheng WU. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[7]无人机发展综述[J]. 秦博,王蕾. 飞航导弹. 2002(08)
[8]CITAVT-IV——视觉导航的自主车[J]. 孙振平,安向京,贺汉根. 机器人. 2002(02)
博士论文
[1]乡村道路环境下农业机器人导航避障算法研究[D]. 刘琼.西北农林科技大学 2017
[2]面向图像语义分割的新型卷积神经网络及其应用研究[D]. Robail Yasrab.中国科学技术大学 2017
[3]基于三维激光雷达的无人驾驶车辆环境建模关键技术研究[D]. 刘健.中国科学技术大学 2016
硕士论文
[1]TensorFlow平台目标检测模型的设计与实现[D]. 韩卓.北京邮电大学 2019
[2]基于深度强化学习的无人车控制系统的设计与实现[D]. 张磊.中国地质大学(北京) 2019
[3]基于深度残差全卷积神经网络的交通图像分割方法研究[D]. 张超.长安大学 2019
[4]无人系统的自主导航技术研究与验证[D]. 严甲汉.电子科技大学 2018
[5]基于残差学习U型卷积神经网络的乳腺超声图像肿瘤分割研究[D]. 梁舒.华南理工大学 2018
[6]基于天空区域分割的暗原色先验去雾优化技术[D]. 茅天诒.南京航空航天大学 2017
[7]无人机航迹规划及导航系统的研究[D]. 王尔刚.天津大学 2014
[8]基于机器视觉的无人车道路识别[D]. 秦玲.西安工业大学 2013
本文编号:2937930
【文章来源】:河南大学河南省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
全卷积神经网络原理图
面向UAS场景图像分割的深度学习算法研究与应用18运用比较多的CNN模型,VGG16的模型图如图3-1所示。从图中可以看出VGG16处理图像的优良性,但平时的CNN方法需要花费更多的时间和精力对原本的处理结果进行再度处理,VGG16对处理图像更加细节便利,还不浪费时间。因此,本论文选择VGG16来进行研究分析。VGG16网络由于其优良的计算特性在复杂不容易解决的神经网络中进行图像处理。它在大规模视觉识别挑战赛中获得了最优秀的分类性能奖。VGG16包括16个权重层(由卷积层构成)和5个最大池化层(池化窗口2×2,池化步长为1)。最大池化层把13层卷积层变成5个区域,第1和第2区域都有2个卷积层,第3到第5区域各自有3个卷积层。每个区域里面卷积层的核通道数都一样,网络层的深浅决定了通道数的多少。第4和第5区域通道数比较多,分别高达256和512个,但是第2区域和第3区域的通道数比较少,分别只有64和128个。这说明了卷积层网络越深,通道数量越多。VGG16网络有3×3的卷积核,且卷积步长为1,池化层把经过卷积层处理后的图像进行再处理,降采样仅仅变成原来的二分之一。16个权重层里还有3层全连接层,它们位于13层卷积层和所有最大池化层之后,均有各自明确的分工。其中前2层功能相当于图像抽象特征,第3层功能为整理类别。神经元个数不是固定不变的,它的多少跟数据的分类数量有关,文献[54]中的神经元个数为1000,而且VGG16网络中还可以通过Softmax激活函数将结果进行再处理。VGG用它优良的性能证明了网络深浅对算法有不可磨灭的影响。由于不同数量相同尺寸大小的卷积层堆叠出来的感受野不同,为了达到保持感受野大小不变的效果,可以让几个小尺寸卷积层堆叠起来。图3-1VGG16模型图
TernausNet[59]模型也是一种编码器-解码器体系结构,它使用 VGG 网络,包含 11 个顺序层作为其编码器。实验结果表明,在 ImageNet 上预先训练的 VGG 网络达到了提高U-Net 网络性能的目的,具有相对较好的图像分割性能。这三种(FCN8、FCN32、SegNet)利用具有不同连续层数的 VGG 网络,说明了 VGG 网络结构层次。 3.2.2 KittiSeg 数据集 本文在进行数据集的标注时采用的软件是 Labelme,用 Labelme 技术对 KittiSeg 数据集和 CamVid 数据集进行标注。Labelme 是麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发的图像标注工具。
【参考文献】:
期刊论文
[1]美国防部《无人系统综合路线图》分析[J]. 王杰东,刘北,董强健. 飞航导弹. 2019(05)
[2]基于全卷积神经网络与条件随机场的车道识别方法[J]. 叶子豪,孙锐,王慧慧. 光电工程. 2019(02)
[3]云计算与信息资源共享管理机制[J]. 钟瑛. 电子技术与软件工程. 2019(02)
[4]基于TensorFlow的移动终端图像识别方法[J]. 熊亚蒙. 无线互联科技. 2018(21)
[5]组合全卷积神经网络和条件随机场的道路分割[J]. 宋青松,张超,陈禹,王兴莉,杨小军. 清华大学学报(自然科学版). 2018(08)
[6]智能无人自主系统发展趋势(英文)[J]. Tao ZHANG,Qing LI,Chang-shui ZHANG,Hua-wei LIANG,Ping LI,Tian-miao WANG,Shuo LI,Yun-long ZHU,Cheng WU. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[7]无人机发展综述[J]. 秦博,王蕾. 飞航导弹. 2002(08)
[8]CITAVT-IV——视觉导航的自主车[J]. 孙振平,安向京,贺汉根. 机器人. 2002(02)
博士论文
[1]乡村道路环境下农业机器人导航避障算法研究[D]. 刘琼.西北农林科技大学 2017
[2]面向图像语义分割的新型卷积神经网络及其应用研究[D]. Robail Yasrab.中国科学技术大学 2017
[3]基于三维激光雷达的无人驾驶车辆环境建模关键技术研究[D]. 刘健.中国科学技术大学 2016
硕士论文
[1]TensorFlow平台目标检测模型的设计与实现[D]. 韩卓.北京邮电大学 2019
[2]基于深度强化学习的无人车控制系统的设计与实现[D]. 张磊.中国地质大学(北京) 2019
[3]基于深度残差全卷积神经网络的交通图像分割方法研究[D]. 张超.长安大学 2019
[4]无人系统的自主导航技术研究与验证[D]. 严甲汉.电子科技大学 2018
[5]基于残差学习U型卷积神经网络的乳腺超声图像肿瘤分割研究[D]. 梁舒.华南理工大学 2018
[6]基于天空区域分割的暗原色先验去雾优化技术[D]. 茅天诒.南京航空航天大学 2017
[7]无人机航迹规划及导航系统的研究[D]. 王尔刚.天津大学 2014
[8]基于机器视觉的无人车道路识别[D]. 秦玲.西安工业大学 2013
本文编号:2937930
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2937930.html