当前位置:主页 > 科技论文 > 自动化论文 >

基于生成对抗网络的遮挡目标识别

发布时间:2021-07-20 10:38
  遮挡目标识别在人工智能领域扮演着极其重要的角色,而解决遮挡目标识别问题中最关键的一步是图像修复。图像修复是一项艰巨的任务,是图像研究领域中能够改善图像质量的一种处理技术,它需要根据图像已有数据去还原图像中损坏的区域。在实际的图像获取中,由于多种受损噪声,光线强暗及实物遮挡等因素,造成了图片质量严重下降。因此图像修复研究意义极为重要。生成对抗网络(Generative Adversarial Networks,GAN)是一种借用对抗思想提出的神经网络架构,是人工智能时代最有发展前景的无监督学习模型之一。本文借助GAN的对抗思想,设计受损图像的修复方法,融合挤压激励块(Squeeze-and-Excitation Networks,SENet)和自注意力机制(Self-Attentive,SA)在特征提取上的优势,对图像修复的细节进行探究,使得在整个图像修复的过程中计算效率和修复结果更好。本文主要完成以下工作:首先,提出了一种基于挤压激励块的深度卷积生成对抗网络遮挡图像修复模型(Occlusion Image Recognition by Deep Convolution Generati... 

【文章来源】:中国矿业大学江苏省 211工程院校 教育部直属院校

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

基于生成对抗网络的遮挡目标识别


遮挡类型检测Figure1-1Occlusiontypedetection在图1-1中,展示了四种遮挡类型:手部遮挡、身体遮挡、眼镜遮挡和口罩

原理图,原理,模型,生成模型


P偷男阅?产生影响,因此研究者们会对判别模型的方法给予更高的关注。GAN主要通过D和G的博弈来训练网络模型,训练过程中通过D和G的相互竞争让这两个模型分别得到增强。由于判别模型D的博弈,让生成模型G在没有大量先验知识和先验分布的前提下,也能很好的学习真实的数据分布规律并逼近真实数据,最终生成模型产生的数据可以欺骗判别模型,让生成的图片达到以假乱真的效果(即D无法将G生成的图片与真实图片区别开来,这样,G和D就达到了纳什均衡)。迄今为止,判别模型在深度学习乃至机器学习领域取得了巨大成功,其模型如图1-2所示:图1-2生成对抗网络原理Figure1-2GenerativeadversarialnetworkprincipleGAN在发展时期,产生了广泛流行的架构,如DCGAN[51]、BigGAN[52]、StackGAN[53]、CycleGAN[54]、CGAN[55]、WGAN[56]等。这些架构展示了非常好的效果。深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks:DCGAN)是AlecRadford等人[51]在2016年提出的改进GAN模型,

架构图,编码器,架构


硕士学位论文102相关算法与理论2RelatedAlgorithmandTheory2.1生成对抗网络概述(SummarizeofGenerativeAdversarialNetworks)2.1.1自编码器(Autoencoder)自编码器[57]其实是一种利用反向传播算法[58]的神经网络(NeuralNetwork)模型,输入值和输出值都是无监督学习,主要包括两个部分:编码器(Encoder)和解码器(Decoder)。图2-1给出了一种最简单的自编码器架构。图2-1简单自编码器架构Figure2-1SimpleAutoencoderarchitecture首先,编码器(Encoder)主要是将音频、向量或者图片作为输入并做降维操作转换成中间变量,此中间变量远小于输入,因为自动编码器与数据高度相关,所以它经常被用于生成与现有数据集类似的数据。比如,编码器能将输入大小为128*128的图像转换128*1的输出h,即为了使图像更节省空间对其压缩。编码器是将个输转换成个背景变量c,下列公式中输是12,,,Txxx,编码器网络将输Tx个特征向量和上个时间的状态t1h,用函数f表示编码器的转换公式如式(2-1)所示:1(,)ttthfxh(2-1)接着编码器通过函数q将th转换为背景变量c

【参考文献】:
期刊论文
[1]基于欠完备自编码器的用户用电行为分类分析方法[J]. 黄奇峰,杨世海,邓欣宇,陈海文,王守相.  电力工程技术. 2019(06)
[2]基于Keras的MNIST数据集识别模型[J]. 郭梦洁,杨梦卓,马京九.  现代信息科技. 2019(14)
[3]基于VAE和GAN融合网络的mnist手写体数字图像生成方法[J]. 陈丽芳,芦国军.  廊坊师范学院学报(自然科学版). 2019(02)
[4]基于时空双流卷积与LSTM的人体动作识别[J]. 毛志强,马翠红,崔金龙,王毅.  软件. 2018(09)
[5]图像质量评价:融合视觉特性与结构相似性指标[J]. 朱新山,姚思如,孙彪,钱永军.  哈尔滨工业大学学报. 2018(05)
[6]基于卷积神经网络的图像识别算法研究[J]. 张荣磊,田爱奎,谭浩,郑睿.  山东理工大学学报(自然科学版). 2018(01)
[7]低秩鲁棒性主成分分析的遮挡人脸识别[J]. 唐娴,黄军伟.  南京理工大学学报. 2017(04)
[8]有遮挡人脸识别综述:从子空间回归到深度学习[J]. 李小薪,梁荣华.  计算机学报. 2018(01)
[9]不同池化模型的卷积神经网络学习性能研究[J]. 刘万军,梁雪剑,曲海成.  中国图象图形学报. 2016(09)
[10]稀疏表示分类中遮挡字典构造方法的改进[J]. 朱明旱,李树涛,叶华.  计算机辅助设计与图形学学报. 2014(11)

硕士论文
[1]基于低秩稀疏分解的遮挡人脸识别研究[D]. 虞涛.南京邮电大学 2019
[2]基于生成式对抗网络的图像风格迁移方法研究[D]. 陈光启.北京邮电大学 2019
[3]面向局部遮挡的人脸识别方法研究及实现[D]. 林胜光.电子科技大学 2018
[4]高鲁棒性视频人脸表情识别系统的研究与实现[D]. 生梦林.大连理工大学 2018
[5]基于深度多级残差网络的图像分类研究[D]. 郭丽茹.华北电力大学 2018
[6]有遮挡人脸识别的特征选择与提取[D]. 李晶晶.浙江工业大学 2017
[7]基于Django框架的图书管理系统的设计与实现[D]. 王兆媛.吉林大学 2016



本文编号:3292668

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3292668.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户96cd3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com