基于全卷积神经网络的高分辨率航空影像建筑物提取方法研究
发布时间:2021-01-07 05:34
随着高分辨率航空影像空间分辨率的提高,地物纹理信息变得更加丰富和复杂,使得从高分辨影像中提取建筑物信息面临巨大挑战。因此采用一种基于全卷积神经网络的高分辨率航空影像中建筑物提取方法,实现端到端的建筑物位置等信息提取。整个模型框架以SegNet模型为基础,在上采样阶段结合SegNet模型中的存储最大池化索引和U-Net模型中的跳跃连接,有效地将低层次和高层次的特征图融合,进行更好的建筑物边界定位。在原有框架的基础上,采用迁移学习思想利用构建的训练样本库对权重进行微调,使网络能够输出稳健的适用于建筑物区域识别的高层次视觉特征。实验采用国际摄影测量与遥感学会公开数据集验证采用方法的有效性和稳健性。实验结果表明,此方法能够有效地提取场景中的建筑物区域。而且,与其他方法相比,该方法在召回率上平均优于2.33%,在精确率上平均优于5.33%,在准确率上优于7.22%。
【文章来源】:地理信息世界. 2020,27(02)
【文章页数】:6 页
【部分图文】:
本文方法的流程图
编码器网络的架构在拓扑上与VGG16网络[13]中的13个卷积层相同。每个编码器由卷积层、批归一化层、RELU组成,之后执行具有2×2窗口和步幅2的最大池化,输出结果相当于系数为2的下采样。最大池化用于实现输入图像中小空间位移的平移不变性,而下采样在特征图中捕获和存储每个像素的大范围上下文信息。编码器网络在编码和获取高层次和抽象语义信息的同时,下采样的操作导致了地物间边缘等细节信息的丢失。因此在下采样之前SegNet模型采用存储最大池化索引的策略捕获和存储边界信息,如图2所示。图3 SegNet模型解码
图2 SegNet模型编码经过编码器编码后的特征图分辨率小于原图像,因此需要利用上采样恢复至原尺寸。在SegNet模型中,每个编码器层具有对应的解码器层,因此解码器网络也具有13层。解码网络主要采用上采样方式映射编码后的低分辨率特征图到输入分辨率的特征图。考虑到编码器中下采样的操作,使得高分辨率中包含的非常细节的边界信息缺失。SegNet模型的解码器使用在相应编码器的最大池化步骤中预先存储的最大池化索引来执行非线性上采样,如图3所示。在解码器中重用最大池化索引的操作不仅可以改善不同地物间的边界划分,而且减少了端到端训练时的参数数量。上采样后产生的图是稀疏的,然后与可训练的滤波器卷积以产生密集的特征图。最终解码器输出的密集特征图被馈送到多级Softmax分类器以独立地为每个像素产生类条件概率。Softmax分类器的输出是K通道图像的概率,其中K是类别的数量,预测的分类结果对应于在每个像素处具有最大概率的类。
【参考文献】:
期刊论文
[1]多特征多尺度相结合的高分辨率遥感影像建筑物提取[J]. 林雨准,张保明,徐俊峰,侯凯,周迅. 测绘通报. 2017(12)
[2]多尺度多特征融合的高分辨率遥感影像分类[J]. 陈苏婷,王慧. 量子电子学报. 2016(04)
[3]基于深度学习的高分辨率遥感影像分类研究[J]. 刘大伟,韩玲,韩晓勇. 光学学报. 2016(04)
[4]面向对象和规则的高分辨率影像分类研究[J]. 李朝奎,方文,董小姣. 测绘通报. 2015(09)
[5]基于高分辨率遥感影像分类的城镇土地利用规划监测[J]. 张超,李智晓,李鹏山,杨建宇,朱德海. 农业机械学报. 2015(11)
[6]面向对象的泰安市高分辨率影像住宅建筑物提取[J]. 董小姣,张东水,李朝奎. 地理空间信息. 2013(01)
[7]面向对象的高分辨率影像分类与信息提取[J]. 张俊,于庆国,侯家槐. 遥感技术与应用. 2010(01)
博士论文
[1]基于深度学习的高光谱影像分类方法研究[D]. 马晓瑞.大连理工大学 2017
硕士论文
[1]基于深度学习的图像分类及其在高光谱图像中的应用研究[D]. 李新国.南京航空航天大学 2016
本文编号:2962009
【文章来源】:地理信息世界. 2020,27(02)
【文章页数】:6 页
【部分图文】:
本文方法的流程图
编码器网络的架构在拓扑上与VGG16网络[13]中的13个卷积层相同。每个编码器由卷积层、批归一化层、RELU组成,之后执行具有2×2窗口和步幅2的最大池化,输出结果相当于系数为2的下采样。最大池化用于实现输入图像中小空间位移的平移不变性,而下采样在特征图中捕获和存储每个像素的大范围上下文信息。编码器网络在编码和获取高层次和抽象语义信息的同时,下采样的操作导致了地物间边缘等细节信息的丢失。因此在下采样之前SegNet模型采用存储最大池化索引的策略捕获和存储边界信息,如图2所示。图3 SegNet模型解码
图2 SegNet模型编码经过编码器编码后的特征图分辨率小于原图像,因此需要利用上采样恢复至原尺寸。在SegNet模型中,每个编码器层具有对应的解码器层,因此解码器网络也具有13层。解码网络主要采用上采样方式映射编码后的低分辨率特征图到输入分辨率的特征图。考虑到编码器中下采样的操作,使得高分辨率中包含的非常细节的边界信息缺失。SegNet模型的解码器使用在相应编码器的最大池化步骤中预先存储的最大池化索引来执行非线性上采样,如图3所示。在解码器中重用最大池化索引的操作不仅可以改善不同地物间的边界划分,而且减少了端到端训练时的参数数量。上采样后产生的图是稀疏的,然后与可训练的滤波器卷积以产生密集的特征图。最终解码器输出的密集特征图被馈送到多级Softmax分类器以独立地为每个像素产生类条件概率。Softmax分类器的输出是K通道图像的概率,其中K是类别的数量,预测的分类结果对应于在每个像素处具有最大概率的类。
【参考文献】:
期刊论文
[1]多特征多尺度相结合的高分辨率遥感影像建筑物提取[J]. 林雨准,张保明,徐俊峰,侯凯,周迅. 测绘通报. 2017(12)
[2]多尺度多特征融合的高分辨率遥感影像分类[J]. 陈苏婷,王慧. 量子电子学报. 2016(04)
[3]基于深度学习的高分辨率遥感影像分类研究[J]. 刘大伟,韩玲,韩晓勇. 光学学报. 2016(04)
[4]面向对象和规则的高分辨率影像分类研究[J]. 李朝奎,方文,董小姣. 测绘通报. 2015(09)
[5]基于高分辨率遥感影像分类的城镇土地利用规划监测[J]. 张超,李智晓,李鹏山,杨建宇,朱德海. 农业机械学报. 2015(11)
[6]面向对象的泰安市高分辨率影像住宅建筑物提取[J]. 董小姣,张东水,李朝奎. 地理空间信息. 2013(01)
[7]面向对象的高分辨率影像分类与信息提取[J]. 张俊,于庆国,侯家槐. 遥感技术与应用. 2010(01)
博士论文
[1]基于深度学习的高光谱影像分类方法研究[D]. 马晓瑞.大连理工大学 2017
硕士论文
[1]基于深度学习的图像分类及其在高光谱图像中的应用研究[D]. 李新国.南京航空航天大学 2016
本文编号:2962009
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2962009.html