约束条件下的结构化统计声学模型及非平行语料语音转换
发布时间:2017-10-09 17:46
本文关键词:约束条件下的结构化统计声学模型及非平行语料语音转换
更多相关文章: 语音转换 结构化高斯混合模型 非平行语料 约束条件 快速匹配算法
【摘要】:语音转换是指将A说话人的语音进行转换并使其听起来像B说话人的语音,且保持语义内容不变的一种技术。传统的说话人语音转换方法大多基于平行语料,通过对平行训练语料的联合训练得到短时谱转换函数。但由于实际情况的限制,完全平行的高质量训练语料是非常难以获得有时甚至是不可能获得的,并且联合训练计算量大,故平行语料语音转换的发展受到限制。本文提出约束条件下结构化高斯混合模型并将其应用于非平行语料语音转换。首先,从源与目标说话人的非平行语料中提取出少量相同音节,在结构化高斯混合模型(SGMM:Structure Gaussian Mixture Model)的训练过程中,利用这些相同音节包含的语义信息及声学特征对应关系对K均值聚类中心进行约束,并在期望最大化迭代过程中对语音帧属于某高斯分量的后验概率进行修正,训练出基于约束的结构化高斯混合模型。然后,根据全局声学结构原理,利用模型快速匹配算法对源和目标说话人的约束条件下的结构化高斯混合模型的高斯分布进行匹配对准,得到短时谱转换函数。主观及客观评价实验结果表明,在转换后语音与目标语音之间的谱失真,转换后语音的目标倾向性和转换后语音的质量等方面,使用本文提出的转换方法优于传统的结构化语音转换方法,转换系统的性能也与基于平行语料的语音转换方法的性能更为接近。本课题主要对以下几个方面进行研究:1、通过对高斯混合模型(GMM:Gaussian Mixture Model)的理解和分析,将GMM应用于平行语料语音转换系统,对其转换性能进行评价并指出该方法的特点及存在的问题。2、深入研究全局声学结构及其原理,详细分析传统结构化非平行语料语音转换方法存在的问题,提出了一种快速模型匹配算法和基于约束条件的结构化高斯混合模型的非平行语料语音转换方法。3、在基于少量约束信息的基础上,实现高质量结构化非平行语料语音转换系统。4、利用主观和客观测评准则,对传统的高斯混合模型转换法,传统的结构化方法以及约束条件下的SGMM(C-SGMM)方法的实验结果进行测评,并对测评结果进行详细的分析,说明本课题提出方法的有效性及优越性。
【关键词】:语音转换 结构化高斯混合模型 非平行语料 约束条件 快速匹配算法
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 中文摘要4-6
- Abstract6-10
- 第一章 绪论10-17
- 1.1 语音转换的定义10-11
- 1.2 语音转换的研究意义与应用前景11-13
- 1.3 课题的国内外研究现状13-14
- 1.4 课题研究目标及主要工作14-16
- 1.5 论文内容安排16-17
- 第二章 语音转换理论基础17-40
- 2.1 语音信号概述17-21
- 2.1.1 语音信号的产生原理17-18
- 2.1.2 语音信号产生的数学模型18-21
- 2.2 语音信号分析21-31
- 2.2.1 预处理22-28
- 2.2.2 基音周期估计28-29
- 2.2.3 线性预测分析29-31
- 2.2.4 倒谱分析31
- 2.3 语音的个性特征分析31-32
- 2.4 STRAIGHT语音分析-合成算法32-34
- 2.4.1 去除周期性影响的谱估计33
- 2.4.2 平滑可靠的基频轨迹的提取33-34
- 2.4.3 语音合成34
- 2.5 语音转换系统概述34-40
- 2.5.1 语音转换的基本原理34-35
- 2.5.2 语音转换系统的系统组成35
- 2.5.3 语音转换的主要方法35-38
- 2.5.4 语音转换性能的评价准则38-40
- 第三章 基于平行语料联合训练的语音转换方法40-45
- 3.1 系统构成40
- 3.2 语音特征参数的时间对齐40-42
- 3.3 高斯混合模型42-43
- 3.3.1 高斯混合模型的基本原理42
- 3.3.2 高斯混合模型的训练42-43
- 3.3.3 高斯混合模型训练的参数设置43
- 3.4 基于高斯混合模型语音转换的转换函数43-44
- 3.4.1 基频转换函数43-44
- 3.4.2 短时谱转换函数44
- 3.5 基于平行语料联合训练的语音转换的局限性44-45
- 第四章 约束条件下的结构化统计声学模型及非平行语料语音转换45-56
- 4.1 系统构成45-46
- 4.2 约束条件下的结构化高斯混合模型46-50
- 4.2.1 结构化高斯混合模型的基本原理46-48
- 4.2.2 基于约束的K均值聚类48-49
- 4.2.3 基于约束的EM算法49-50
- 4.3 基于约束条件下结构化高斯混合模型的语音转换50-52
- 4.4 快速模型匹配算法52-56
- 第五章 语音转换实验及分析56-59
- 5.1 语料库描述及参数设置56
- 5.2 客观评价56-57
- 5.3 主观评价57-59
- 第六章 总结与展望59-61
- 6.1 总结59-60
- 6.2 展望60-61
- 参考文献61-66
- 攻读硕士学位期间公开发表的论文66-67
- 致谢67-68
【参考文献】
中国期刊全文数据库 前2条
1 左国玉,刘文举,阮晓钢;声音转换技术的研究与进展[J];电子学报;2004年07期
2 左国玉,刘文举,阮晓钢;基于遗传径向基神经网络的声音转换[J];中文信息学报;2004年01期
,本文编号:1001582
本文链接:https://www.wllwen.com/kejilunwen/wltx/1001582.html