基于交叉对齐方法的中文文本风格转换

发布时间:2023-05-04 04:22
  在人工智能技术的不断发展过程中,文本和图像的风格转换是对人工智能发展水平的重要衡量标准,然而语言风格转换滞后于图像的风格转换。由于图像是连续的,可以通过转换函数直接学习和优化,使得图像的风格转换实现起来较为简单,而语言的不连续性增大了研究的难度。在自然语言处理领域的研究中,需要大规模平行语料的支持,但是目前平行语料库的规模十分有限,尤其是在新兴领域,平行语料的数量更是匮乏。对于英文文本,国外已有一些研究能够实现跨语料库的文本风格转换,但是中文的风格转换缺少相关的研究。基于此,本文结合现有的交叉对齐方法和中文语言的特点,实现中文文本的风格转换,本文所做的工作如下:1.中文数据集的获取及处理。在本文中,用到的数据集是公开的豆瓣电影的评论数据,原始数据集包含200多万条评论。为了使数据满足模型的需要,本文主要对原始数据进行了以下处理:将原始数据按照评级分为正面数据和负面数据;将正、负面的句子按照词的个数分为短评论文本和长评论文本;对数据进行去除停用词和命名实体词识别。2.中文文本风格转换及评估。现有的文本风格转换都是基于英文文本的,本文借助交叉对齐方法实现了中文的文本风格转换,并在真实语料库...

【文章页数】:47 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 文本风格转换的研究背景及意义
    1.2 风格转换研究现状
    1.3 论文组织结构
第二章 相关技术研究
    2.1 词语的向量化表示
        2.1.1 One-Hot表示
        2.1.2 Word2Vec表示
    2.2 基于深度神经网络的风格转换
        2.2.1 传统神经网络模型
        2.2.2 卷积神经网络模型
        2.2.3 循环神经网络模型
        2.2.4 LSTM长短期记忆网络模型
    2.3 风格转换相关技术
        2.3.1 变分自动编码
        2.3.2 生成式对抗网络
        2.3.3 交叉对齐方法
        2.3.4 教授强制算法
        2.3.5 支持向量机和LibSvm
    2.4 本章小结
第三章 风格转换算法设计
    3.1 自动编码
        3.1.1 自动编码对齐
        3.1.2 交叉对齐自动编码
    3.2 转换效果的评估
        3.2.1 风格转换强度
        3.2.2 内容保留程度
    3.3 本章小结
第四章 实验结果与分析
    4.1 系统开发环境
    4.2 系统参数设置
    4.3 系统的实现
        4.3.1 数据集
        4.3.2 数据预处理
    4.4 实验结果分析
        4.4.1 实验结果
        4.4.2 实验结果分析
    4.5 本章小结
第五章 总结和展望
    5.1 总结
    5.2 展望
参考文献
致谢



本文编号:3807941

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3807941.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eb4cc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com