基于深层网络的城市街道场景的语义分割的方法研究
发布时间:2021-01-26 06:57
随着人工智能技术的高速发展,“感知城市”这一词汇渐渐被人们关注并熟知。图像语义分割技术是实现“感知城市”的一种效率高、成本低的手段,在许多领域得到广泛应用。比如,通过对飞机的航拍图像进行语义分割以辅助飞行员确定安全着陆点;对行车记录仪传输图像进行语义分割以帮助驾驶员规划安全可靠的行车路线。近年来,基于深层卷积神经网络的方法在语义分割问题上取得了一系列的突破。但实际中,训练所得的分割模型往往参数量过于庞大,可移植性差,不利于实际工程应用;同时由于城市街道场景图像复杂导致网络整体的分割结果不够理想。本文针对上述问题,深入研究了城市街道场景下的图像语义分割方法,主要工作如下:从模型轻量化的角度出发,提出一种针对复杂场景下的轻量多通道特征融合的语义分割模型。首先,本文在Deeplab V2的基础上进行了改进,将Deeplab V2网络与多通道特征融合结构RefineNet结合,有效改善了模型的分割细节。然后,在此基础上提出轻量化改进,将深度可分离卷积引入空洞空间金字塔池化模型(ASPP)与RefineNet并提出轻量化结构Light-ASPP与Light-RefineNet(V1、V2),有效...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
语义分割图示
在其他条件相同的情况下,单个传统卷积的感受野是 3,单个空洞卷积的感受野是 5。图2.3 不同空洞率的空洞卷积图 2.3 是不同空洞率下的大小为3 3的空洞卷积核,可以看出,随着空洞率的增加,空洞卷积捕获的感受野也会随之增加,但卷积核的权重参数保持不变,计算复杂度不会增加。对于空洞卷积,不同的空洞率所捕获的感受野也会不同。空洞率过小,感受野随之减小,提取到的局部信息较多,全局信息较少,不利于对全局分割的整体把控;空洞率过大,感受野随之增大,提取到的全局信息较多,局部信息较少,不利于改善边缘细节信息。因此选用合适空洞率的空洞卷积在图像语义分割领域至关重要。(2)池化层卷积层是由一系列的卷积运算所组成的网络层。池化操作同样通过滑动窗口的方式提取特征,这一点与卷积的运算方式相同。但与卷积不同的是池化过程中没有可以学习的参数,它通过池化函数(pooling function)来使池化窗某一个位置的特征代替所有位置的统计特征作为输出。常用在语义分割的池化方式有最大池化(maxpooling)和全局平均池化(global average pooling
三种激活函数示意图
本文编号:3000675
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
语义分割图示
在其他条件相同的情况下,单个传统卷积的感受野是 3,单个空洞卷积的感受野是 5。图2.3 不同空洞率的空洞卷积图 2.3 是不同空洞率下的大小为3 3的空洞卷积核,可以看出,随着空洞率的增加,空洞卷积捕获的感受野也会随之增加,但卷积核的权重参数保持不变,计算复杂度不会增加。对于空洞卷积,不同的空洞率所捕获的感受野也会不同。空洞率过小,感受野随之减小,提取到的局部信息较多,全局信息较少,不利于对全局分割的整体把控;空洞率过大,感受野随之增大,提取到的全局信息较多,局部信息较少,不利于改善边缘细节信息。因此选用合适空洞率的空洞卷积在图像语义分割领域至关重要。(2)池化层卷积层是由一系列的卷积运算所组成的网络层。池化操作同样通过滑动窗口的方式提取特征,这一点与卷积的运算方式相同。但与卷积不同的是池化过程中没有可以学习的参数,它通过池化函数(pooling function)来使池化窗某一个位置的特征代替所有位置的统计特征作为输出。常用在语义分割的池化方式有最大池化(maxpooling)和全局平均池化(global average pooling
三种激活函数示意图
本文编号:3000675
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3000675.html