当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于文本深度分析的剧情生成方法研究

发布时间:2021-01-22 00:07
  随着计算机技术的发展,自然语言生成技术(Natural Language Generation,NLG)越来越受到人们的重视。自然语言生成技术可以用于生成与人类表达方式类似的自然语言句子。文本复述是自然语言生成技术的一个分支,它以另外一种方式表达原句子的含义,能够应用于诸如机器翻译、智能问答等众多场景。文本复述技术已经有了较长时间的发展,但是目前对于由电影对话信息进行复述生成的研究比较少。以客观的方式对电影中的故事进行描述,生成对话的剧情信息,可以使用户高效的理解电影对话语义。但是由于对话信息的口语化和主观性特征,使得利用对话生成复述的技术面临很多困难。本文提出基于文本深度分析的剧情生成方法,具体可以分为自然语言对话抽取和电影剧情生成两个部分。对于电影字幕中的对话信息,本文设计了一个自然语言对话抽取方案。通过针对电影对话进行不流畅检测及处理,去除句子中的冗余信息;对对话进行指代消解,提升句子的可理解性;将问句与答句进行信息合并,建立问答句之间的紧密联系,防止完整信息被拆分。为了将电影中不同的故事进行整理,本文利用语义关联关系对电影对话进行对话信息的划分,并使用基于语义的聚类方法进行对话... 

【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于文本深度分析的剧情生成方法研究


基于Attention机制的复述生成模型

电影,文本,实验过程,自然语言


共包含 2825 个文档,其中包括 31832 个原文档和 18569 个摘要句子,通过对数据集进行预处理,每篇文章都会与其中一个摘要配对,形成一对输入和输出来训练模型。图5.1 电影《The Matrix Revolutions》的复述文本节选实验过程本文的测试工作主要包括面向电影字幕的自然语言对话抽取实验和基于深度学习的电影剧情生成实验。5.2.1面向电影字幕的自然语言对话抽取本文根据准备的数据集进行实验,首先需要进行的是面向电影字幕的自然语言对话抽取。本文以电影《The Matrix Revolutions》的字幕原文节选为例,介绍各步是如何处理电影字幕的。电影字幕中,每一个字幕单元主要包括 3 个信息:字幕单元序号。


本文编号:2992146

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2992146.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ffbd2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com