基于Unet网络多任务学习的遥感图像建筑地物语义分割
发布时间:2021-11-09 12:32
为准确分割出高分辨率遥感图像中的建筑地物,提出一种基于Unet网络多任务学习的建筑地物语义分割方法。首先,根据遥感图像建筑地物真值图生成边界距离图,并将该遥感图像及其真值图共同作为Unet网络的输入;然后,在基于Res Net网络构建的Unet网络末端加入建筑地物预测层与边界距离预测层,搭建多任务网络;最后,定义多任务网络的损失函数,并使用Adam优化算法训练该网络。在Inria航空遥感图像建筑地物标注数据集上进行实验,结果表明,与全卷积网络结合多层感知器方法相比,VGG16网络、VGG16+边界预测、Res Net50和本文方法的交并比值分别提升5.15,6.94,6.41和7.86百分点,准确度分别提升至94.71%,95.39%,95.30%和96.10%,可实现高精度的建筑地物提取。
【文章来源】:国土资源遥感. 2020,32(04)北大核心CSCD
【文章页数】:10 页
【部分图文】:
多任务网络结构
影响基于深度学习的语义分割方法时效性的2个关键因素为将所有训练样本输入到网络训练一个周期所需的时间和网络的收敛速率。为此,不同方法分别在训练集与验证集上进行测试时,其损失值随训练周期增加的变化趋势如图2所示。为了进行公平对比,5种不同方法训练的优化均采用Adam算法。从图2(a)不同方法在训练集上的损失值变化趋势可以看出,FCN+MLP基准方法的损失值降低速率最慢,而本文方法的损失值降低速率最快,表明本文方法可以在更少的训练周期内获得网络收敛。此外,Res Net50和VGG16+边界预测的损失值降低速率基本持平,亦表明加入边界预测层的多任务网络可使单一任务的Unet网络具有更好的性能。从图2(b)在验证集上的损失值变化趋势可以看出,本文方法的曲线波动较小,表明本文方法可有效避免过拟合或欠拟合现象,从而使网络收敛加快,减少网络训练时间。
河南省新乡市高新区的覆盖范围达52 km2,包含建筑、道路、植被、裸地和水体等多种地物类型。以我国高分2号卫星于2018年4月16日拍摄的该区域实际遥感图像为例,不同方法分割该实际遥感图像建筑地物的实验结果如图3所示。结合图3(a)遥感图像的目视解译,从图3可以看出FCN-MLP和VGG16方法存在过分割现象,究其原因是它们将部分道路或邻近建筑地物误分割为同一建筑地物,尤其FCN+MLP方法的误分割现象较为严重;VGG16+边界检测方法,较VGG16方法建筑地物边缘部分更为准确;而Res Net50方法对建筑地物则存在欠分割现象,这是由于该方法对边缘检测不够准确的缘故。如上节所述,本文方法擅长准确地分割小规模建筑地物,故其对该覆盖范围较大、包含较多类型地物的实际遥感图像的建筑地物分割较为准确。通过对图3(f)像素数目的计算,并与该研究区域2017年的统计年鉴资料对比,本文方法对该实际遥感图像建筑地物的分割准确度Acc值为86.93%。
【参考文献】:
期刊论文
[1]基于全卷积神经网络的多源高分辨率遥感道路提取[J]. 张永宏,夏广浩,阚希,何静,葛涛涛,王剑庚. 计算机应用. 2018(07)
[2]基于邻域总变分和势直方图函数的高分辨率遥感影像建筑物提取[J]. 施文灶,刘金清. 计算机应用. 2017(06)
本文编号:3485347
【文章来源】:国土资源遥感. 2020,32(04)北大核心CSCD
【文章页数】:10 页
【部分图文】:
多任务网络结构
影响基于深度学习的语义分割方法时效性的2个关键因素为将所有训练样本输入到网络训练一个周期所需的时间和网络的收敛速率。为此,不同方法分别在训练集与验证集上进行测试时,其损失值随训练周期增加的变化趋势如图2所示。为了进行公平对比,5种不同方法训练的优化均采用Adam算法。从图2(a)不同方法在训练集上的损失值变化趋势可以看出,FCN+MLP基准方法的损失值降低速率最慢,而本文方法的损失值降低速率最快,表明本文方法可以在更少的训练周期内获得网络收敛。此外,Res Net50和VGG16+边界预测的损失值降低速率基本持平,亦表明加入边界预测层的多任务网络可使单一任务的Unet网络具有更好的性能。从图2(b)在验证集上的损失值变化趋势可以看出,本文方法的曲线波动较小,表明本文方法可有效避免过拟合或欠拟合现象,从而使网络收敛加快,减少网络训练时间。
河南省新乡市高新区的覆盖范围达52 km2,包含建筑、道路、植被、裸地和水体等多种地物类型。以我国高分2号卫星于2018年4月16日拍摄的该区域实际遥感图像为例,不同方法分割该实际遥感图像建筑地物的实验结果如图3所示。结合图3(a)遥感图像的目视解译,从图3可以看出FCN-MLP和VGG16方法存在过分割现象,究其原因是它们将部分道路或邻近建筑地物误分割为同一建筑地物,尤其FCN+MLP方法的误分割现象较为严重;VGG16+边界检测方法,较VGG16方法建筑地物边缘部分更为准确;而Res Net50方法对建筑地物则存在欠分割现象,这是由于该方法对边缘检测不够准确的缘故。如上节所述,本文方法擅长准确地分割小规模建筑地物,故其对该覆盖范围较大、包含较多类型地物的实际遥感图像的建筑地物分割较为准确。通过对图3(f)像素数目的计算,并与该研究区域2017年的统计年鉴资料对比,本文方法对该实际遥感图像建筑地物的分割准确度Acc值为86.93%。
【参考文献】:
期刊论文
[1]基于全卷积神经网络的多源高分辨率遥感道路提取[J]. 张永宏,夏广浩,阚希,何静,葛涛涛,王剑庚. 计算机应用. 2018(07)
[2]基于邻域总变分和势直方图函数的高分辨率遥感影像建筑物提取[J]. 施文灶,刘金清. 计算机应用. 2017(06)
本文编号:3485347
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3485347.html