基于MFCC和GMM语音转换技术研究
发布时间:2017-10-04 09:49
本文关键词:基于MFCC和GMM语音转换技术研究
更多相关文章: 语音转换 梅尔倒谱参数 混合高斯模型 平均意见得分测试
【摘要】:语音是人们最直接的沟通方式,对语音信号的处理一直是目前最为热门的研究方向之一。语音转换指通过语音处理手段改变一个人的语音个性特征,使之具有另一个人的语音特征,但同时保持原有的语义信息不变。语音转换是语音信号处理一个重要的分支领域,其涉及到了多个学科,包括生理、声学、信号处理等多个学科,在多媒体配音,医学治疗发声器官受损及保密领域都有十分广阔的应用前景。本文考虑在梅尔倒谱系数和高斯混合模型的基础上设计一个语音转换系统。为此,本文首先介绍了语音转换的定义以及研究的现实价值;接着在此基础上对语音转换的两大主要步骤进行了分析:特征参数的提取以及转换函数的确定。梅尔倒谱系数考虑了人耳的听觉特性,高斯混合模型也很好的拟合了转换函数的曲线,二者都是语音转换领域中热门的选择之一;随后本文设计了一个语音转换系统,将系统分为三个部分:提取部分、训练部分和转换部分,对每一个部分的设计与实现都加以详细的介绍;最后,本文设定了不同的测试方向,采用频谱失真度和平均意见得分测试两种方法从主观和客观两个方面对转换的效果做出了评价。
【关键词】:语音转换 梅尔倒谱参数 混合高斯模型 平均意见得分测试
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 摘要3-4
- Abstract4-7
- 1 绪论7-12
- 1.1 语音转换的定义7
- 1.2 语音转换的意义与应用7-8
- 1.3 国内外研究现状及问题8-9
- 1.4 论文内容和结构安排9-12
- 2 语音转换相关理论12-26
- 2.1 语音发音系统12-13
- 2.2 语音信号的数学模型13-15
- 2.3 语音信号的时域分析15-16
- 2.3.1 短时能量和短时平均幅度15-16
- 2.3.2 短时平均过零率16
- 2.4 语音信号的频域分析16-17
- 2.5 相关声学参数17-18
- 2.6 语音转换的主要方法18-23
- 2.6.1 矢量量化法18-19
- 2.6.2 说话人插值法19-20
- 2.6.3 线性多变量回归法20-21
- 2.6.4 神经网络法21
- 2.6.5 高斯混合模型法21-22
- 2.6.6 隐马尔科夫模型法22-23
- 2.7 评价标准23-26
- 2.7.1 客观评价标准24
- 2.7.2 主观测试标准24-26
- 3 特征参数26-36
- 3.1 常见特征参数26-28
- 3.1.1 LPC系数26-27
- 3.1.2 LPCC特征参数27-28
- 3.1.3 MFCC特征参数28
- 3.2 人的听觉系统和语音的感知28-30
- 3.2.1 听觉系统的生理机制28-29
- 3.2.2 听觉特性29-30
- 3.3 Mel频率简介30-36
- 3.3.1 梅尔倒谱系数MFCC及其提取算法31
- 3.3.2 求取MFCC系数的具体算法和步骤31-36
- 4 语音转换的实现过程36-49
- 4.1 提取部分36-41
- 4.2 训练部分41-45
- 4.2.1 动态时间规整DTW41
- 4.2.2 训练算法41-45
- 4.3 转换部分45-49
- 4.3.1 最小均方误差(MMSE)准则45
- 4.3.2 转换算法45-47
- 4.3.3 语音的后期处理47-49
- 5 实验与仿真49-53
- 5.1 实验准备49
- 5.1.1 实验的语音库49
- 5.1.2 性能指标49
- 5.2 实验结果与分析49-52
- 5.2.1 MFCC系数对转换性能的影响49-50
- 5.2.2 GMM方法对转换性能的影响50-51
- 5.2.3 说话人对转换性能的影响51-52
- 5.3 本章小结52-53
- 6 总结与展望53-55
- 6.1 工作总结53
- 6.2 工作展望53-55
- 致谢55-56
- 参考文献56-59
【参考文献】
中国期刊全文数据库 前1条
1 宋鹏;王浩;赵力;;基于混合Gauss归一化的语音转换方法[J];清华大学学报(自然科学版);2013年06期
中国硕士学位论文全文数据库 前2条
1 张晓枫;基于小波变换与GMM的说话人识别研究[D];西安电子科技大学;2002年
2 任永梅;自适应阈值小波包语音增强算法的研究[D];太原理工大学;2013年
,本文编号:969992
本文链接:https://www.wllwen.com/kejilunwen/wltx/969992.html