基于深度学习的图像语义分割技术研究与实现
发布时间:2021-10-16 18:33
全卷积神经网络是在卷积神经网络的基础上将最后的全连接层换成同维度的1*1的卷积层,再辅以反卷积和上采样层构成的。通过全卷积神经网络可以完成图像的语义分割。图像的语义分割是指从视觉层出发通过一定的手段将图像的对象层提取出来,通过对视觉层和对象层的综合,得到图像的概念层信息。即图像的语义信息。课题系统研究了卷积神经网络的基本理论,对图像语义分割的概念进行了介绍,进而引出了全卷积神经网络,之后以全卷积神经网络FCN为研究对象,对全卷积神经网络从结构到训练进行了系统探究。全卷积神经网络的训练需要借助深度学习技术,而深度学习实践中深度学习框架是至关重要的,课题选择谷歌开源的深度学习框架caffe作为平台,VOC2012为数据集,对FCN进行了训练,训练得到的模型MIOU值达到了59.65%。为了使训练对特定的场景更有针对性,在voc2012数据集的基础上加入了自制数据集,对FCN进行了二次训练,经过训练,针对特定场景的MIOU值达到了62%。此外,还对FCN的衍生版U-net和SegNet进行了介绍,详细介绍了U-net和SegNet的结构。U-net主要针对小样本量的深度学习任务,SegNet...
【文章来源】:河北科技大学河北省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
人工智能、机器学习、深度学习的关系图
9论是线性可分的算法还是非线性可分的算法,其能表达的特征总是简单的、单一的。深度学习的灵感来源于人类的神经系统,人类利用已有的先验知识和深层神经元表达出来的物体特征来对周围环境和目标物体进行识别判断。深度学习模拟人脑的工作过程,建立深层神经网络来表达物体的更高维的特征。通过大量的数据长时间的训练,使深层神经网络收敛,从而能够智能地处理特定地任务。2.2人工神经网络的基本思想神经网络从产生伊始,就充满着传奇的色彩。从生物学的角度来说,对神经网络的概念并不陌生,但是在实际的工业生产和科学研究领域,神经网络就有些传奇了。在生产和生活中使用的神经网络称为人工神经网络,并非所熟知的生物神经元,是对生物神经元工作原理的高度抽象所产生的人工神经元,可以借助电子电路和计算机编程来实现。人工神经网络[13]虽然不具有生物神经网络高度的智能化水平,但是可以针对某些方面有针对性地对其进行训练,让其具备相关领域的智能化处理功能。经过多年的发展,产生了一批典型的神经网络,如:卷积神经网络、bp神经网络、RBF神经网络等。2.2.1单层神经元结构神经元,又称感知器,是神经网络的基本组成单元。任何复杂的神经网络都是由神经元组成的。比较复杂的神经网络一般有多层,每一层由多个神经元组成,不同层之间神经元的类型可以不同,激活函数的类型也可以不同。单个神经元的结构如图2-2所示:图2-2感知器结构示意图单层感知器的计算公式如式(2-3):a=f(wp+b)(2-3)
1211111,11iRRRinpwb===+(2-5)对于多层神经网络而言,层数以及每层神经元数量的设计至关重要。输入层和输出层神经元数量都是由外部问题所决定的。如果有n个外部变量作为输入,输入层就有n个神经元。同理,如果网络有m个输出,输出层就有m个神经元。至于隐层神经元的个数,是目前神经网络领域一个非常活跃的研究课题,目前尚无定论。2.3反向传输神经网络算法单个神经元感知机和多神经元单层感知机的训练,在训练开始之初,给神经网络的各个参数赋初值,一般采用随机生成的数对其进行赋初值。在训练的过程中,根据预测值与实际值的差值不断地调整网络的权值,直到其误差收敛到一定的范围之内。但是对与多层神经网络而言,由于其有多层,每一层都有自己的权值矩阵,需要利用预测值误差对每一层的权值矩阵进行调整,从而使整个神经网络收敛,由此,单层神经元的训练和学习算法已经不再适应多层神经元的训练,多层神经元的训练需要使用反向传播算法[16]。为了更好地理解反向传播算法,先对前向传播算法进行说明。神经网络的前向传播是指从输入层开始,输入数据向着输出层不断向前传播,神经网络的各层之间都是相连的,每层的任意一个神经元都与下一层的全部的神经元连接,本层神经元对应的权值与输入数据进行加权和计算,结果作为下一层神经元的输入,最后通过一个非线性激活函数,得到的输出即为本层的输出。一个简单的BP神经网络如图2-3所示。图2-3简单BP神经网络结构图
【参考文献】:
期刊论文
[1]基于改进卷积神经网络的短时公交客流预测[J]. 陈深进,薛洋. 计算机科学. 2019(05)
[2]基于一维卷积神经网络和Soft-Max分类器的风电机组行星齿轮箱故障检测[J]. 李东东,王浩,杨帆,郑小霞,周文磊,邹胜华. 电机与控制应用. 2018(06)
[3]基于深度学习U-Net模型的石块图像分割算法[J]. 徐江川,金国强,朱天奕,余芬芬,郭杰,金一,竺长安. 工业控制计算机. 2018(04)
[4]结合局部灰度差异的噪声图像分割模型[J]. 李钢,李海芳,尚方信,郭浩. 计算机应用. 2018(03)
[5]基于条件深度卷积生成对抗网络的图像识别方法[J]. 唐贤伦,杜一铭,刘雨微,李佳歆,马艺玮. 自动化学报. 2018(05)
[6]人工智能发展应用领域及发展趋势探究[J]. 张艺琼. 数码世界. 2018(02)
[7]深度学习中三种常用激活函数的性能对比研究[J]. 周畅,米红娟. 北京电子科技学院学报. 2017 (04)
[8]基于卷积神经网络的轿车车型精细识别方法[J]. 陈宏彩,程煜,张常有. 河北科技大学学报. 2017(06)
[9]用深度学习技术解决图像语义分割问题[J]. 蒋子源. 电子制作. 2017(20)
[10]基于Caffe深度学习框架的车牌数字字符识别算法研究[J]. 欧先锋,向灿群,郭龙源,涂兵,吴健辉,张国云. 四川大学学报(自然科学版). 2017(05)
硕士论文
[1]基于深度学习的室内点云场景语义理解研究[D]. 李文强.哈尔滨工业大学 2018
[2]基于深度神经网络的实时多物体检测[D]. 杨强.哈尔滨工业大学 2018
[3]基于卷积神经网络的雾霾时空演化预测方法研究[D]. 黄伟政.电子科技大学 2018
[4]基于深度学习的单目图像深度估计[D]. 李耀宇.哈尔滨理工大学 2017
[5]结合FCN与条件随机场的道路场景分割模型的研究[D]. 韩浩.武汉理工大学 2017
[6]基于无监督学习的EIT图像重建方法研究[D]. 韩倩.天津工业大学 2017
[7]图像模糊复原及质量评价算法研究[D]. 尹磊.哈尔滨工业大学 2015
[8]图像分割评价方法研究[D]. 刘春燕.西安电子科技大学 2011
本文编号:3440298
【文章来源】:河北科技大学河北省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
人工智能、机器学习、深度学习的关系图
9论是线性可分的算法还是非线性可分的算法,其能表达的特征总是简单的、单一的。深度学习的灵感来源于人类的神经系统,人类利用已有的先验知识和深层神经元表达出来的物体特征来对周围环境和目标物体进行识别判断。深度学习模拟人脑的工作过程,建立深层神经网络来表达物体的更高维的特征。通过大量的数据长时间的训练,使深层神经网络收敛,从而能够智能地处理特定地任务。2.2人工神经网络的基本思想神经网络从产生伊始,就充满着传奇的色彩。从生物学的角度来说,对神经网络的概念并不陌生,但是在实际的工业生产和科学研究领域,神经网络就有些传奇了。在生产和生活中使用的神经网络称为人工神经网络,并非所熟知的生物神经元,是对生物神经元工作原理的高度抽象所产生的人工神经元,可以借助电子电路和计算机编程来实现。人工神经网络[13]虽然不具有生物神经网络高度的智能化水平,但是可以针对某些方面有针对性地对其进行训练,让其具备相关领域的智能化处理功能。经过多年的发展,产生了一批典型的神经网络,如:卷积神经网络、bp神经网络、RBF神经网络等。2.2.1单层神经元结构神经元,又称感知器,是神经网络的基本组成单元。任何复杂的神经网络都是由神经元组成的。比较复杂的神经网络一般有多层,每一层由多个神经元组成,不同层之间神经元的类型可以不同,激活函数的类型也可以不同。单个神经元的结构如图2-2所示:图2-2感知器结构示意图单层感知器的计算公式如式(2-3):a=f(wp+b)(2-3)
1211111,11iRRRinpwb===+(2-5)对于多层神经网络而言,层数以及每层神经元数量的设计至关重要。输入层和输出层神经元数量都是由外部问题所决定的。如果有n个外部变量作为输入,输入层就有n个神经元。同理,如果网络有m个输出,输出层就有m个神经元。至于隐层神经元的个数,是目前神经网络领域一个非常活跃的研究课题,目前尚无定论。2.3反向传输神经网络算法单个神经元感知机和多神经元单层感知机的训练,在训练开始之初,给神经网络的各个参数赋初值,一般采用随机生成的数对其进行赋初值。在训练的过程中,根据预测值与实际值的差值不断地调整网络的权值,直到其误差收敛到一定的范围之内。但是对与多层神经网络而言,由于其有多层,每一层都有自己的权值矩阵,需要利用预测值误差对每一层的权值矩阵进行调整,从而使整个神经网络收敛,由此,单层神经元的训练和学习算法已经不再适应多层神经元的训练,多层神经元的训练需要使用反向传播算法[16]。为了更好地理解反向传播算法,先对前向传播算法进行说明。神经网络的前向传播是指从输入层开始,输入数据向着输出层不断向前传播,神经网络的各层之间都是相连的,每层的任意一个神经元都与下一层的全部的神经元连接,本层神经元对应的权值与输入数据进行加权和计算,结果作为下一层神经元的输入,最后通过一个非线性激活函数,得到的输出即为本层的输出。一个简单的BP神经网络如图2-3所示。图2-3简单BP神经网络结构图
【参考文献】:
期刊论文
[1]基于改进卷积神经网络的短时公交客流预测[J]. 陈深进,薛洋. 计算机科学. 2019(05)
[2]基于一维卷积神经网络和Soft-Max分类器的风电机组行星齿轮箱故障检测[J]. 李东东,王浩,杨帆,郑小霞,周文磊,邹胜华. 电机与控制应用. 2018(06)
[3]基于深度学习U-Net模型的石块图像分割算法[J]. 徐江川,金国强,朱天奕,余芬芬,郭杰,金一,竺长安. 工业控制计算机. 2018(04)
[4]结合局部灰度差异的噪声图像分割模型[J]. 李钢,李海芳,尚方信,郭浩. 计算机应用. 2018(03)
[5]基于条件深度卷积生成对抗网络的图像识别方法[J]. 唐贤伦,杜一铭,刘雨微,李佳歆,马艺玮. 自动化学报. 2018(05)
[6]人工智能发展应用领域及发展趋势探究[J]. 张艺琼. 数码世界. 2018(02)
[7]深度学习中三种常用激活函数的性能对比研究[J]. 周畅,米红娟. 北京电子科技学院学报. 2017 (04)
[8]基于卷积神经网络的轿车车型精细识别方法[J]. 陈宏彩,程煜,张常有. 河北科技大学学报. 2017(06)
[9]用深度学习技术解决图像语义分割问题[J]. 蒋子源. 电子制作. 2017(20)
[10]基于Caffe深度学习框架的车牌数字字符识别算法研究[J]. 欧先锋,向灿群,郭龙源,涂兵,吴健辉,张国云. 四川大学学报(自然科学版). 2017(05)
硕士论文
[1]基于深度学习的室内点云场景语义理解研究[D]. 李文强.哈尔滨工业大学 2018
[2]基于深度神经网络的实时多物体检测[D]. 杨强.哈尔滨工业大学 2018
[3]基于卷积神经网络的雾霾时空演化预测方法研究[D]. 黄伟政.电子科技大学 2018
[4]基于深度学习的单目图像深度估计[D]. 李耀宇.哈尔滨理工大学 2017
[5]结合FCN与条件随机场的道路场景分割模型的研究[D]. 韩浩.武汉理工大学 2017
[6]基于无监督学习的EIT图像重建方法研究[D]. 韩倩.天津工业大学 2017
[7]图像模糊复原及质量评价算法研究[D]. 尹磊.哈尔滨工业大学 2015
[8]图像分割评价方法研究[D]. 刘春燕.西安电子科技大学 2011
本文编号:3440298
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3440298.html
最近更新
教材专著