基于改进GPT-2模型的童话故事文本生成研究
发布时间:2021-06-13 13:42
随着二胎政策的实施,我国新生儿的数量正在逐年增加,对于幼儿的教育也日益重视。而现在,我国市场上的童话故事过于老套,且缺乏定制性,数量也并不足以满足现在日益增长的需求。另一方面,随着深度学习领域的高速发展,其所包含的很多领域都有巨大突破,如计算机视觉、自然语言处理与实时决策等;但是随着模型的不断发展,如何将各个纵向发展的领域结合,让模型真正解决现实问题、体现价值也是一个十分重要的问题。所以本文试图结合最新深度学习的模型从而实现从卡通图片生成童话故事,为学龄前儿童提供更丰富的语料。本文构建了一个端到端的、可以从卡通图片生成童话故事的系统,结合图像描述模型与语言模型,并利用集束搜索算法改进。系统主要分为三个模块,分别是图像描述模块、连接模块以及文本生成模块。在图像生成模块,利用全新的编码器-解码器架构,实现从一张图片生成关于该图片的短文本描述;在连接模块,主要利用集束搜索算法对模块一输出部分以及模块三的输入端进行改进,将更多的图像信息融入文本中;在文本生成模块,改进了最新的语言模型GPT-2,用于生成长文本(童话故事)。在模型评估方面,首先对图像描述模块进行了机器翻译指标BLEU的评估,本文...
【文章来源】:上海师范大学上海市
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
本文任务示意图
第1章绪论上海师范大学硕士学位论文6既增加了生成文本的信息,又让文本有了更多的“想象力”。1.3研究内容、方法和结构本文主要研究的问题是利用深度学习技术,从一张卡通图像生成与之相关的童话故事。为了实现这样的目的,本文设计了一种端到端的系统,实现了该功能,可以从任意一张卡通图像生成给定字数的故事。示意图如下所示:图1.1本文任务示意图本文实现的系统主要分成三个模块。下面对于具体模块分别说明。(1)图像描述模块这一模块的内容主要是利用编码器-解码器(encoder-decoder)架构实现从一张图片生成短文本,去描述该图片。其生成过程示意图如下所示:图1.2模块一(图像描述任务)生成过程示意图图像描述任务一直是深度学习领域所重点研究的内容,它能够实现以“看图说话”的形式自动获取与指定图像相关的文本信息。本文不同于传统的图像描述任务的做法,在编码器和解码器部分分别采用DeneseNet模型网络的共享层和改进的字符级循环神经网络(CharRNN),并且把字符级循环神经网络内部的传统
第1章绪论上海师范大学硕士学位论文8的文字,而是把一个分布列直接传入下面的GPT-2语言模型中,进行文本生成。其示意图如下所示:图1.3模块二(集束搜索改进生成机制)示意图这样处理的目的是让图像生成的文本更具有多样性,因为一张图片的信息经过图像描述模块的编码、解码之后肯定是有一定程度的损失,而集束搜索方法可以让信息更多的保留,这有助于后面的长文本生成。这些保留的信息是和图片相关的,在某种程度上可以解决主题文本生成的问题。而主题生成也是一个现在学界正在研究的“老大难”问题。(3)文本生成模块语言模型是现在自然语言处理领域中研究的主要问题,语言模型主要是分为上游任务与下游任务,上游任务是根据输出的数据对其进行特征的提取,生成一系列特征,值得一提的是,不同于卷积神经网络,语言模型的特征往往是比原始信息更加冗长的,这是为了下游任务的处理。而下游任务则是具体的应用,例如文本生成,人机对话等问题。本文采用目前最为先进的语言模型GPT-2作为文本生成的模型基础,并且改进了其模型前部负责接受输入的部分,原始的模型接受的输入是文本格式的,而经过了模块二,GPT-2语言模型接受的是一个分布列,并利用此分布列生成相应的长文本段落。对于语言模型GPT-2的改进主要还有词语表示(tokenizer)部分,例如“我”这个字具体对应着词表的什么位置,这个位置不是随机得到的,而是依据以往的
【参考文献】:
期刊论文
[1]机器翻译质量评估刍议[J]. 马鸣皓. 宁波教育学院学报. 2019(06)
[2]基于一种视觉注意力机制的图像描述方法[J]. 薛炜,刘惠义. 信息技术. 2020(01)
[3]童话文本教学现状分析与策略解蔽[J]. 应紫庭,马进. 文学教育(上). 2019(11)
博士论文
[1]基于视觉的文本生成方法研究[D]. 徐俊.中国科学技术大学 2018
硕士论文
[1]基于生成式对抗网络的文本生成问题的研究[D]. 代威.吉林大学 2018
[2]基于区域注意力机制的图像描述算法[D]. 吴黄子桑.武汉大学 2018
本文编号:3227631
【文章来源】:上海师范大学上海市
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
本文任务示意图
第1章绪论上海师范大学硕士学位论文6既增加了生成文本的信息,又让文本有了更多的“想象力”。1.3研究内容、方法和结构本文主要研究的问题是利用深度学习技术,从一张卡通图像生成与之相关的童话故事。为了实现这样的目的,本文设计了一种端到端的系统,实现了该功能,可以从任意一张卡通图像生成给定字数的故事。示意图如下所示:图1.1本文任务示意图本文实现的系统主要分成三个模块。下面对于具体模块分别说明。(1)图像描述模块这一模块的内容主要是利用编码器-解码器(encoder-decoder)架构实现从一张图片生成短文本,去描述该图片。其生成过程示意图如下所示:图1.2模块一(图像描述任务)生成过程示意图图像描述任务一直是深度学习领域所重点研究的内容,它能够实现以“看图说话”的形式自动获取与指定图像相关的文本信息。本文不同于传统的图像描述任务的做法,在编码器和解码器部分分别采用DeneseNet模型网络的共享层和改进的字符级循环神经网络(CharRNN),并且把字符级循环神经网络内部的传统
第1章绪论上海师范大学硕士学位论文8的文字,而是把一个分布列直接传入下面的GPT-2语言模型中,进行文本生成。其示意图如下所示:图1.3模块二(集束搜索改进生成机制)示意图这样处理的目的是让图像生成的文本更具有多样性,因为一张图片的信息经过图像描述模块的编码、解码之后肯定是有一定程度的损失,而集束搜索方法可以让信息更多的保留,这有助于后面的长文本生成。这些保留的信息是和图片相关的,在某种程度上可以解决主题文本生成的问题。而主题生成也是一个现在学界正在研究的“老大难”问题。(3)文本生成模块语言模型是现在自然语言处理领域中研究的主要问题,语言模型主要是分为上游任务与下游任务,上游任务是根据输出的数据对其进行特征的提取,生成一系列特征,值得一提的是,不同于卷积神经网络,语言模型的特征往往是比原始信息更加冗长的,这是为了下游任务的处理。而下游任务则是具体的应用,例如文本生成,人机对话等问题。本文采用目前最为先进的语言模型GPT-2作为文本生成的模型基础,并且改进了其模型前部负责接受输入的部分,原始的模型接受的输入是文本格式的,而经过了模块二,GPT-2语言模型接受的是一个分布列,并利用此分布列生成相应的长文本段落。对于语言模型GPT-2的改进主要还有词语表示(tokenizer)部分,例如“我”这个字具体对应着词表的什么位置,这个位置不是随机得到的,而是依据以往的
【参考文献】:
期刊论文
[1]机器翻译质量评估刍议[J]. 马鸣皓. 宁波教育学院学报. 2019(06)
[2]基于一种视觉注意力机制的图像描述方法[J]. 薛炜,刘惠义. 信息技术. 2020(01)
[3]童话文本教学现状分析与策略解蔽[J]. 应紫庭,马进. 文学教育(上). 2019(11)
博士论文
[1]基于视觉的文本生成方法研究[D]. 徐俊.中国科学技术大学 2018
硕士论文
[1]基于生成式对抗网络的文本生成问题的研究[D]. 代威.吉林大学 2018
[2]基于区域注意力机制的图像描述算法[D]. 吴黄子桑.武汉大学 2018
本文编号:3227631
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3227631.html