基于卷积神经网络的高分辨率遥感影像变化检测
发布时间:2021-09-19 07:45
随着航天航空技术的高速发展,当前对地观测系统获取空间数据的能力和质量不断提高,卫星遥感技术已经迈入亚米级时代。高分辨率遥感影像包含更加复杂的形状、纹理、结构和空间信息,因此人们获取高精度的遥感影像的同时,对解译精度又有了更高的要求。作为遥感图像处理的一个重要部分,高分辨率遥感影像变化检测在环境监测、地理数据库更新、灾害救援及城市规划等领域有着重要应用。近年来,深度学习凭借其优异的回归性能被广泛的应用到各个领域,它突破了传统算法的约束,具有很强的泛化能力。将深度学习理论应用到高分辨率遥感影像变化检测是遥感图像处理的研究热点。本文首先指出了高分辨率遥感影像变化检测课题的研究背景和意义,并对当前国内外研究现状进行阐述,分析了本课题的研究基础——卷积神经网络,并将卷积神经网络语义分割的思想引入遥感影像的变化检测中。根据ASPP提取不同感受野上下文信息的特点,结合Inception结构的多尺度特征提取融合的优势,将ASPP和Inception结构融入到Unet网络模型中,提出了ASPP Inception-Unet。该模型将Unet编码路径中每级的第一个卷积层替换为Inception结构,加强了...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
局部感知结构图
第2章理论基础10图2.1局部感知结构图3)池化池化的主要作用是过滤掉一些不重要的高频信息,在CNN卷积操作提取特征时,会产生较大的数据量,无法适用于海量数据的计算,池化的目的是缩减图像的大小,将图像一定大小区域的相邻像元用一个具有代表性的值代替。相邻像素通常从方形矩阵中选择,并且依据问题的不同,所合并在一起的像素的数目也不同,输出值通常为所选像素的平均取值或者最大取值。图2.2所示,是使用平均池化和最大池化方法进行池化的结果,在不重叠操作元素的情况下,现在将输入图像的像素合并成2×2的矩阵,在输入图像经过池化操作后,就被缩减为2×2像素的图像。图2.2池化操作示意图4)多重结构为了克服传统神经网络单层结构在特征提取方面的局限性,CNN演进为多层结构。CNN能够以自动的方式进行特征学习主要是因为它具有的深度的多层的非线性变换结构,每多一层就可以进一步提取图像的特征,一定程度避免了特征提取的单一化效应,使得CNN模型学习到的特征更具全局化,提高模型对目标识别的泛化能力。
第2章理论基础11图2.3多重结构.2.3卷积神经网络结构与特点CNN是一种多层的人工神经网络,主要的结构包括输入层、卷积层、池化层、激活函数和全连接层[43]。2.3.1输入层输入层的作用是将待识别或者待训练的图像读取到CNN中,通常彩色图像为3层相互叠加的2维矩阵组成,灰度图像为1层的2维矩阵组成。在使用CNN进行图像学习特征时,输入为进行过归一化的图片数据,一张行数a,列数b,通道数c的图片,表示为a*b*c。常规彩色图像是由RGB三个分量构成,它的通道数为3。从计算机的识别数字图像角度出发,a*b*c的图片即为c个a*b的矩阵的依次叠加。
本文编号:3401316
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
局部感知结构图
第2章理论基础10图2.1局部感知结构图3)池化池化的主要作用是过滤掉一些不重要的高频信息,在CNN卷积操作提取特征时,会产生较大的数据量,无法适用于海量数据的计算,池化的目的是缩减图像的大小,将图像一定大小区域的相邻像元用一个具有代表性的值代替。相邻像素通常从方形矩阵中选择,并且依据问题的不同,所合并在一起的像素的数目也不同,输出值通常为所选像素的平均取值或者最大取值。图2.2所示,是使用平均池化和最大池化方法进行池化的结果,在不重叠操作元素的情况下,现在将输入图像的像素合并成2×2的矩阵,在输入图像经过池化操作后,就被缩减为2×2像素的图像。图2.2池化操作示意图4)多重结构为了克服传统神经网络单层结构在特征提取方面的局限性,CNN演进为多层结构。CNN能够以自动的方式进行特征学习主要是因为它具有的深度的多层的非线性变换结构,每多一层就可以进一步提取图像的特征,一定程度避免了特征提取的单一化效应,使得CNN模型学习到的特征更具全局化,提高模型对目标识别的泛化能力。
第2章理论基础11图2.3多重结构.2.3卷积神经网络结构与特点CNN是一种多层的人工神经网络,主要的结构包括输入层、卷积层、池化层、激活函数和全连接层[43]。2.3.1输入层输入层的作用是将待识别或者待训练的图像读取到CNN中,通常彩色图像为3层相互叠加的2维矩阵组成,灰度图像为1层的2维矩阵组成。在使用CNN进行图像学习特征时,输入为进行过归一化的图片数据,一张行数a,列数b,通道数c的图片,表示为a*b*c。常规彩色图像是由RGB三个分量构成,它的通道数为3。从计算机的识别数字图像角度出发,a*b*c的图片即为c个a*b的矩阵的依次叠加。
本文编号:3401316
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3401316.html