基于深度学习的汉语韵律短语识别

发布时间:2022-07-12 11:25
  语音合成技术的发展。使得通过语言和机器进行交流变成了可能。在语音合成系统中,评价一段合成的语音水平主要从两方面来看,可懂度、自然度。目前,语音的可懂度已经基本达到预期的要求,但是语音合成的自然度仍需要提高。影响语音合成自然度的因素很多,韵律结构是其中重要因素之一。为了更好的划分韵律结构,本文从语音和文本两个方面出发,融合文本特征、句子相似度特征、短语结构特征和语音声学特征,采用深度学习的方法来识别韵律短语边界的位置。本文的主要研究内容有:(1)韵律短语边界处文本特征的获取基于韵律标注文本语料,在对韵律短语边界进行词法、句法分析的基础上,构建韵律边界的文本特征集。文本特征包括:表达词与词之间关系的词向量特征、基于句法结构分析的相似性特征、及短语结构的边界位置特征等。(2)韵律短语边界处语音特征的获取基于真实的韵律标注语音语料,分析韵律边界处及边界前后的语音声学表现,并从语音音频中提取韵律短语边界处的声学特征构建语音特征集。语音特征主要有:声母时长、韵母时长、音节时长、无声段时长等。(3)文本和语音特征相结合的韵律短语边界预测将文本特征和语音特征进行有效的融合,从多层次多角度描述韵律短语的... 

【文章页数】:67 页

【学位级别】:硕士

【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
    1.1 研究目的及意义
    1.2 汉语韵律分析及韵律层级划分
    1.3 国内外研究现状
    1.4 研究问题及内容
    1.5 论文组织结构
第二章 相关知识
    2.1 词向量
    2.2 模型介绍
        2.2.1 Bi-LSTM模型
        2.2.2 Bi-GRU模型
        2.2.3 CRF模型
    2.3 句子间相似度计算方法
        2.3.1 编辑距离计算
        2.3.2 杰卡德系数计算
        2.3.3 TF计算
    2.4 短语结构分析
第三章 基于文本的特征获取
    3.1 词向量特征
    3.2 句子相似度特征
    3.3 短语结构特征
    3.4 本章小结
第四章 基于语音的特征获取
    4.1 无声段特征
        4.1.1 韵律边界处的语音无声段
        4.1.2 无声段特征的提取方法
    4.2 时长特征
        4.2.1 韵律边界处时长特征
        4.2.2 时长特征的获取方法
    4.3 文本和语音特征结合
    4.4 本章小结
第五章 基于深度学习的韵律短语边界预测
    5.1 特征向量构建
    5.2 韵律边界预测模型
    5.3 实验语料及评价指标
    5.4 实验测试及结果分析
        5.4.1 模型特征与性能分析
        5.4.2 不同方法的对比
    5.5 本章小结
第六章 基于深度学习的韵律短语边界预测系统
    6.1 系统处理流程
    6.2 系统功能模块
    6.3 开发语言
    6.4 系统具体实现
    6.5 本章小结
第七章 总结与展望
    7.1 结论
    7.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式


【参考文献】:
期刊论文
[1]基于双向门控循环单元的3D人体运动预测[J]. 桑海峰,陈紫珍.  电子与信息学报. 2019(09)
[2]基于句法依存和条件随机场的韵律短语识别[J]. 钱揖丽,张二萌.  清华大学学报(自然科学版). 2019(07)
[3]基于Python的大学计算机公共课教学研究[J]. 王润鸿,刘燕.  电脑知识与技术. 2019(12)
[4]基于静音时长和文本特征融合的韵律边界自动标注[J]. 傅睿博,陶建华,李雅,温正棋.  清华大学学报(自然科学版). 2018(01)
[5]杰卡德相似系数在推荐系统中的应用[J]. 张晓琳,付英姿,褚培肖.  计算机技术与发展. 2015(04)
[6]深度学习研究综述[J]. 尹宝才,王文通,王立春.  北京工业大学学报. 2015(01)
[7]大规模语料库上的Stanford和Berkeley句法分析器性能对比分析[J]. 项炜,金澎.  电脑知识与技术. 2013(08)
[8]基于整句相似性计算的韵律短语预测模型[J]. 李剑锋,胡国平,王仁华.  小型微型计算机系统. 2006(10)
[9]应用二叉树剪枝识别韵律短语边界[J]. 荀恩东,钱揖丽,郭庆,宋柔.  中文信息学报. 2006(03)
[10]基于语义依存的汉语句子相似度计算[J]. 李彬,刘挺,秦兵,李生.  计算机应用研究. 2003(12)

硕士论文
[1]语音合成中韵律结构预测改进[D]. 王天慧.北京交通大学 2017
[2]语音韵律短语边界处的声学表现及语音停顿识别[D]. 王娟.山西大学 2017
[3]基于深度神经网络的韵律结构预测研究[D]. 王琦.北京交通大学 2016



本文编号:3659040

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiboshi/3659040.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户957af***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com