基于时长变化的GMM语音转换系统
本文关键词:基于时长变化的GMM语音转换系统,由笔耕文化传播整理发布。
【摘要】:语音信号中除了包含语音内容信息外,还包含说话人声音特征形式信息。在保证发音者语音内容讯息不发生变化的前提下,通过转变源说话人的语音个人特性,使之具备目标说话人语音个人特征的技术称为语音转换。这项技术几乎囊括了语音信号处理领域的各个方面,是当前比较热门的技术之一。针对语音的韵律特征,它对转换系统最终的合成语音的自然度、可懂度有很大影响。本课题在基于传统高斯混合模型的语音转换系统上提出对转换后韵律特征中的时长进行改变的算法,填补了以往通过GMM模型转换后语音自然度不高的弊端,提高转换后语音的可懂度。本论文主要探究了基于高斯混合模型的语音转换系统中所使用的重要技术,再对转换后的语音进行测评,分为客观评价与主观评价,以此判定所设计出的转换系统的好坏程度。主要工作如下:1、基于时长变换的语音转换系统除了完成基本的语音转换要求外,还解决了经系统转换之后获得的合成语音音质不自然粗糙等问题;从语音的发声机理开始研究适合于语音转换系统的语音分析模型,与其相对应的语音参数以及用于语音转换系统中的转换算法。着重研究了基于高斯混合模型的语音转换系统的主要算法,并对其进行了仿真实现,给出了主客观测试结果。2、针对传统语音转换系统普遍存在的语音自然度低的问题,提出并实现了一种基于时长变化的语音转换系统的改进算法,通过对转换后的参数插值变换来改变语音的时长。测评结果表明经过改进后的转换语音自然度和可懂度都有一定程度的提高。3、在采取上述改进算法的GMM语音转换系统中,选取更利于人耳声音感知的美尔倒谱参数MFCC进行变换操作:给出了转换前后语音的MFCC三维图以及语音波形图,实验结果表明采用改进算法后的转换语音和目标语音较为接近,语音转换系统的质量得到了提高。
【关键词】:语音转换系统 时长改进 高斯混合模型 目标语音
【学位授予单位】:长江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 摘要4-5
- 英文摘要5-8
- 第一章 绪论8-12
- 1.1 语音转换的研究意义8-9
- 1.2 国内外研究动态9-10
- 1.3 面临的主要问题10
- 1.4 本文的研究内容及章节安排10-12
- 第二章 语音转换理论基础12-25
- 2.1 语音信号基础理论12-17
- 2.2 语音系统的数学模型17-21
- 2.3 语音转换基本原理21-24
- 2.4 本章小结24-25
- 第三章 语音信号分析与特征参数的提取25-41
- 3.1 语音信号的预处理25-28
- 3.2 语音信号时域分析28-36
- 3.3 语音信号特征参数与提取方法36-39
- 3.4 本章小结39-41
- 第四章 语音转换系统41-48
- 4.1 语音库的设计41
- 4.2 语音的频谱变换41-45
- 4.3 韵律的变换45-47
- 4.4 本章小结47-48
- 第五章 仿真实现48-65
- 5.1 GMM中模型参数估计48-50
- 5.2 高斯混合模型用于语音频谱包络的转换50-51
- 5.3 语音转换系统的性能评价标准51-54
- 5.4 基本GMM语音转换系统的仿真结果与分析54-57
- 5.5 基于时长变化的GMM语音转换系统的实现57-64
- 5.6 本章小结64-65
- 第六章 总结与展望65-67
- 致谢67-68
- 参考文献68-71
- 个人简介71-72
【参考文献】
中国期刊全文数据库 前9条
1 徐宁;杨震;;基于声门波分离的预测型语音转换系统[J];信号处理;2009年04期
2 徐宁;杨震;;高合成质量的语音转换系统[J];应用科学学报;2008年04期
3 朱维彬;吕士楠;;基于语义的语音合成——语音合成技术的现状及展望[J];北京理工大学学报;2007年05期
4 康永国;双志伟;陶建华;张维;;基于混合映射模型的语音转换算法研究[J];声学学报;2006年06期
5 左国玉,刘文举,阮晓钢;基于遗传径向基神经网络的声音转换[J];中文信息学报;2004年01期
6 王金明,张雄伟;话者识别系统中语音特征参数的研究与仿真[J];系统仿真学报;2003年09期
7 王强,余岳峰,张浩炯;利用人工神经网络实现函数逼近[J];计算机仿真;2002年05期
8 朱廷劭,高文;基于数据挖掘的普通话韵律规则学习[J];计算机学报;2000年11期
9 梁志强,李海洲;线性预测编码在变音长语音合成中的应用[J];华南理工大学学报(自然科学版);1998年03期
中国博士学位论文全文数据库 前2条
1 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
2 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库 前3条
1 周莹;高质量语音转换系统中关键技术的研究[D];南京邮电大学;2012年
2 张炳;基于改进GMM和韵律联合短时谱的说话人转换[D];苏州大学;2008年
3 陈迪;语音参数提取算法研究及系统实现[D];重庆大学;2007年
本文关键词:基于时长变化的GMM语音转换系统,由笔耕文化传播整理发布。
,本文编号:401153
本文链接:https://www.wllwen.com/kejilunwen/wltx/401153.html