多层次韵律和短时谱同步变换的情感语音合成
发布时间:2017-08-17 02:28
本文关键词:多层次韵律和短时谱同步变换的情感语音合成
更多相关文章: 多层次韵律 短时谱转换 高斯混合模型 情感语音合成
【摘要】:在日常生活中,声音包含了表示文本内容的语义信息,而且也会传递一些情感信息。对于同一句话,如果说话人说话方式不同,听者所获得的信息也会不同。语音的情感转换,就是在语义相同的情况下,实现声音在不同情感间的转换。因此,情感转换是具有表现力的语音合成的重要研究方向。为了能够合成出高质量的情感语音,本文使用了一种多层次韵律和短时谱同步变换的情感合成方法。通过多层次的方法对高兴、生气、悲伤和中性这4种情感语音建立相应的韵律模型。在此基础上,训练得到中性语音与情感语音之间的映射关系,完成韵律转换。然后,再结合短时谱的转换,运用合成工具(STRAIGHT)最后合成有明显情感倾向的情感语音。对转换语音做ABX和MOS测评,结果表明多层次的方法明显改善了情感转换效果。同时,对于合成的情感语音进行谱失真检测,检测结果表明,相对于只对音节进行转换的方法,本文对于高兴、愤怒和悲伤的转换结果分别提高了2%、4%和6%。
【关键词】:多层次韵律 短时谱转换 高斯混合模型 情感语音合成
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.33
【目录】:
- 中文摘要4-5
- Abstract5-8
- 第一章 序言8-13
- 1.1 情感语音合成概述8
- 1.2 国内外研究现状8-9
- 1.3 情感语音合成的方法9-11
- 1.3.1 波形拼接合成9-10
- 1.3.2 统计参数合成10
- 1.3.3 韵律转换合成10-11
- 1.4 本文主要研究工作及论文及安排11-13
- 第二章 语音情感转换基础知识13-31
- 2.1 语音信号的基础知识13-17
- 2.1.1 语音发音系统13-14
- 2.1.2 语音信号的数学模型14-17
- 2.2 语音信号的预处理17-20
- 2.2.1 预加重17-18
- 2.2.2 分帧与加窗18-19
- 2.2.3 端点检测19-20
- 2.3 特征参数分析20-23
- 2.3.1 基音频率20-22
- 2.3.2 频谱参数22-23
- 2.4 基于GMM的情感转换方法23-27
- 2.4.1 GMM模型概述24-26
- 2.4.2 动态时间规整(DTW)26-27
- 2.5 STRAIGHT合成平台27-29
- 2.6 情感语音转换评价标准29-31
- 2.6.1 客观评价29-30
- 2.6.2 主观评价30-31
- 第三章 情感语音的多层次韵律特征分析31-43
- 3.1 多层次韵律转换概述31-34
- 3.1.1 多层次韵律结构31-32
- 3.1.2 多层次情感转换过程32-34
- 3.2 韵律特征的统计分析34-43
- 3.2.1 基频分析35-38
- 3.2.2 时长分析38-40
- 3.2.3 能量分析40-43
- 第四章多层次韵律和短时谱同步变换的情感转换43-53
- 4.1 基频的转换43-46
- 4.2 时长的转换46-49
- 4.3 能量的转换49-51
- 4.4 短时谱转换51-53
- 第五章 语音情感转换实验与结果分析53-61
- 5.1 情感语音语料库53
- 5.2 实验结果分析53-61
- 5.2.1 传统的音节转换实验结果54-57
- 5.2.2 多层次韵律转换实验结果57-61
- 第六章 总结与展望61-63
- 6.1 工作总结61
- 6.2 工作展望61-63
- 参考文献63-67
- 攻读硕士学位期间发表的论文67-68
- 致谢68-69
【参考文献】
中国期刊全文数据库 前2条
1 刘付民;张治斌;沈记全;;核典型相关分析算法的多特征融合情感识别[J];计算机工程与应用;2014年09期
2 陶建华,蔡莲红;基于音节韵律特征分类的汉语语音合成中韵律模型的研究[J];声学学报;2003年05期
中国硕士学位论文全文数据库 前4条
1 马瑞云;基于谱包络和超音段韵律的语音转换技术研究[D];南京邮电大学;2011年
2 张国伟;语音基频检测及基频模型的研究[D];山东大学;2007年
3 王宁;采用Pitch Target模型与韵律参数调整的语音情感转换[D];苏州大学;2012年
4 鲁小勇;情感语音合成的研究[D];西北师范大学;2013年
,本文编号:686735
本文链接:https://www.wllwen.com/kejilunwen/wltx/686735.html