基于文本深度分析的剧情生成方法研究

发布时间：2021-01-22 00:07

　　随着计算机技术的发展,自然语言生成技术（Natural Language Generation,NLG）越来越受到人们的重视。自然语言生成技术可以用于生成与人类表达方式类似的自然语言句子。文本复述是自然语言生成技术的一个分支,它以另外一种方式表达原句子的含义,能够应用于诸如机器翻译、智能问答等众多场景。文本复述技术已经有了较长时间的发展,但是目前对于由电影对话信息进行复述生成的研究比较少。以客观的方式对电影中的故事进行描述,生成对话的剧情信息,可以使用户高效的理解电影对话语义。但是由于对话信息的口语化和主观性特征,使得利用对话生成复述的技术面临很多困难。本文提出基于文本深度分析的剧情生成方法,具体可以分为自然语言对话抽取和电影剧情生成两个部分。对于电影字幕中的对话信息,本文设计了一个自然语言对话抽取方案。通过针对电影对话进行不流畅检测及处理,去除句子中的冗余信息;对对话进行指代消解,提升句子的可理解性;将问句与答句进行信息合并,建立问答句之间的紧密联系,防止完整信息被拆分。为了将电影中不同的故事进行整理,本文利用语义关联关系对电影对话进行对话信息的划分,并使用基于语义的聚类方法进行对话...

【文章来源】：西安电子科技大学陕西省 211工程院校教育部直属院校

【文章页数】：69 页

【学位级别】：硕士

【部分图文】：

基于文本深度分析的剧情生成方法研究

基于Attention机制的复述生成模型

电影,文本,实验过程,自然语言

共包含 2825 个文档，其中包括 31832 个原文档和 18569 个摘要句子，通过对数据集进行预处理，每篇文章都会与其中一个摘要配对，形成一对输入和输出来训练模型。图5.1 电影《The Matrix Revolutions》的复述文本节选实验过程本文的测试工作主要包括面向电影字幕的自然语言对话抽取实验和基于深度学习的电影剧情生成实验。5.2.1面向电影字幕的自然语言对话抽取本文根据准备的数据集进行实验，首先需要进行的是面向电影字幕的自然语言对话抽取。本文以电影《The Matrix Revolutions》的字幕原文节选为例，介绍各步是如何处理电影字幕的。电影字幕中，每一个字幕单元主要包括 3 个信息：字幕单元序号。

本文编号：2992146

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2992146.html

上一篇：基于改进VMD与GS S VM的轴承故障诊断
下一篇：基于Memetic算法和Spark分布式并行计算的社交网络影响最大化研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|