基于生成对抗网络(GAN)自主海报生成的研究
发布时间:2021-09-04 15:23
图像生成技术广泛的运用在日常生活当中,也是计算机视觉领域极为重要的研究方向。由文本到图像的生成是该方向的一个重要分支,通常的图像生成任务只能完成单个类别的图像合成,无法满足日益复杂精细的生产要求。按照给定条件的文本描述生成内容相符合细节丰富的图像变得尤其重要,特别是对于海报设计工作人员,基于文本生成图像的技术模型的自主海报生成,不仅能够大大减轻海报工作人员的枯燥简单的海报设计工作,将他们从大量重复机械的劳动中解放出来,而且能够提升他们的设计效率,让设计者们从事更加富有创造力的工作。通过文本生成符合文本内容语义表达的图形,首先需要解决计算机如何能够理解文本所包含的语义信息,其次将计算机理解后的文本语义信息转化为对应图形输出,该任务具有很强的挑战性。本文通过对文本生成图像方法进行研究,提出了一种以中文文本为输入,基于改进型对抗生成网络的文本生成图像生成的方法并进行了相应实验进行验证。在综合现有的文本生成图像的研究发现,当前的文本输入都是基于英文字符作为文本输入。为了方便国内设计工作人员,论文提出了用中文作为文本图像生成的文本输入。使用Word2vec模型产生词向量,将词向量输入到Seq2S...
【文章来源】:长江大学湖北省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
变分自编码器的结构示意图
第1章绪论6的神经网络参数,整个训练过程交替进行。通常在实验操作过程当中,生成器每经过k(k<10)次训练以后,然后再训练判别器。通过这样不断对抗博弈的方式,最终生成器可以学得真实数据样本的潜在分布,生成与真实样本基本一致的数据样本。图1-2展示了生成对抗网络的模型:图1-2生成对抗网络的结构示意图Figure1-2Schematicdiagramofgeneratinganadversarialnetwork在生成对抗网络出现以前,大部分的深度学习模型都是监督学习方式进行,而监督学习需要大量运用大量的人力来标注数据集,而深度学习的数据集一般都是非常庞大,而人工标注通常效率低下且成本高昂。而生成对抗网络是非监督的学习,能够自发的学习到真实数据集的潜在分布规律,不需要先验的假设信息,GAN不需要动用大量人工来标注训练数据集,制作每条数据对应的标签,降低了生产成本提高了生产效率,因此GAN在图像生成领域备受科研人员的青睐。但是生成对抗网络自提出来一直存在着训练不稳定,模式崩溃和梯度消失等问题,而这些问题亟待解决。生成对抗网络自2014年提出以来呈现出爆发式发展的趋势,研究论文主要是围绕网络模型结构更改,理论完善以及实际应用展开。在理论方面,MartinArjovsky等人对GAN进行深入研究[26](WassersteinGAN)来提高生成对抗网络的稳定性,WGAN使用Wasserstein距离代替了生成对抗网络的Jenson-Shannon散度来度量真实数据与生成数据分布的差异性,不仅仅消除了梯度消失带来的训练难题,而且解释了网络模式崩溃的根本原因。WGAN在一定程度上解决了生成对抗网络训练困难的问题,但是由于存在Lipschitz条件约束,因此生成对抗网络在训练上存在难点,WGAN通过将神经网络的权重限制在一定范围之内来满足Lipschitz条件约
第2章深度学习理论概述12重值(weight),人工神经网络就是通过这样的方式来模拟人脑的运行过程。人工神经网络的架构,连接方式,权重值和激活函数的选择都会影响神经网络的输出结果。由于神经网络是由一个个简单的神经元相互连接构成,并以此形成了一个大规模的分布式处理器,具有存储知识并利用的特性。这些神经元高度互联,促使系统动态的运行。因此人工神经网络具有并行分布的处理能力,高容错性,智能化,自适应学习等特征。在人工神经网络当中,可以处理文字,数字,图像或者更加抽象的概念。早期的人工神经网络要包含三个组成部分:输入层,隐藏层,输出层。输入层接受来自外部的数据输入;隐藏层进行综合运算;输出层输出系统的结果。神经元之间的连接权重值大小决定了神经元彼此之间联系关系的重要程度。神经元是人工神经网络的基本组成单位,图2-1是人工神经网络当中神经元的模型,如图2.1所示神经元模型由神经连接,累加器,激活函数三部分组成。图2-1神经元的数学模型结构Figure2-1Mathematicalmodelstructureofneuron其中123,|,nixxxRxx为输入,每个输入上有一个权值iwR,此外还有一个偏置项bR。是激活函数,a是神经元的输出。单个神经元的数学模型:1niiiawxb()(2-1)模型的每次学习都会适当的调整权重w和偏置b,经过激活函数将输出a限制在一定的范围之内,经过多次的参数调节之后,输出值趋于稳定,则神经网络模型训练完成。
本文编号:3383517
【文章来源】:长江大学湖北省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
变分自编码器的结构示意图
第1章绪论6的神经网络参数,整个训练过程交替进行。通常在实验操作过程当中,生成器每经过k(k<10)次训练以后,然后再训练判别器。通过这样不断对抗博弈的方式,最终生成器可以学得真实数据样本的潜在分布,生成与真实样本基本一致的数据样本。图1-2展示了生成对抗网络的模型:图1-2生成对抗网络的结构示意图Figure1-2Schematicdiagramofgeneratinganadversarialnetwork在生成对抗网络出现以前,大部分的深度学习模型都是监督学习方式进行,而监督学习需要大量运用大量的人力来标注数据集,而深度学习的数据集一般都是非常庞大,而人工标注通常效率低下且成本高昂。而生成对抗网络是非监督的学习,能够自发的学习到真实数据集的潜在分布规律,不需要先验的假设信息,GAN不需要动用大量人工来标注训练数据集,制作每条数据对应的标签,降低了生产成本提高了生产效率,因此GAN在图像生成领域备受科研人员的青睐。但是生成对抗网络自提出来一直存在着训练不稳定,模式崩溃和梯度消失等问题,而这些问题亟待解决。生成对抗网络自2014年提出以来呈现出爆发式发展的趋势,研究论文主要是围绕网络模型结构更改,理论完善以及实际应用展开。在理论方面,MartinArjovsky等人对GAN进行深入研究[26](WassersteinGAN)来提高生成对抗网络的稳定性,WGAN使用Wasserstein距离代替了生成对抗网络的Jenson-Shannon散度来度量真实数据与生成数据分布的差异性,不仅仅消除了梯度消失带来的训练难题,而且解释了网络模式崩溃的根本原因。WGAN在一定程度上解决了生成对抗网络训练困难的问题,但是由于存在Lipschitz条件约束,因此生成对抗网络在训练上存在难点,WGAN通过将神经网络的权重限制在一定范围之内来满足Lipschitz条件约
第2章深度学习理论概述12重值(weight),人工神经网络就是通过这样的方式来模拟人脑的运行过程。人工神经网络的架构,连接方式,权重值和激活函数的选择都会影响神经网络的输出结果。由于神经网络是由一个个简单的神经元相互连接构成,并以此形成了一个大规模的分布式处理器,具有存储知识并利用的特性。这些神经元高度互联,促使系统动态的运行。因此人工神经网络具有并行分布的处理能力,高容错性,智能化,自适应学习等特征。在人工神经网络当中,可以处理文字,数字,图像或者更加抽象的概念。早期的人工神经网络要包含三个组成部分:输入层,隐藏层,输出层。输入层接受来自外部的数据输入;隐藏层进行综合运算;输出层输出系统的结果。神经元之间的连接权重值大小决定了神经元彼此之间联系关系的重要程度。神经元是人工神经网络的基本组成单位,图2-1是人工神经网络当中神经元的模型,如图2.1所示神经元模型由神经连接,累加器,激活函数三部分组成。图2-1神经元的数学模型结构Figure2-1Mathematicalmodelstructureofneuron其中123,|,nixxxRxx为输入,每个输入上有一个权值iwR,此外还有一个偏置项bR。是激活函数,a是神经元的输出。单个神经元的数学模型:1niiiawxb()(2-1)模型的每次学习都会适当的调整权重w和偏置b,经过激活函数将输出a限制在一定的范围之内,经过多次的参数调节之后,输出值趋于稳定,则神经网络模型训练完成。
本文编号:3383517
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3383517.html
最近更新
教材专著