当前位置:主页 > 科技论文 > 网络通信论文 >

基于GMM和码本映射相结合的语音转换方法研究

发布时间:2017-05-19 11:03

  本文关键词:基于GMM和码本映射相结合的语音转换方法研究,由笔耕文化传播整理发布。


【摘要】:人体发出的语音中包含有各种各样的信息,如说话人语义信息和说话人个性特征的信息等。经常需要用语音信号处理领域的相关知识来分析与处理其中包含的深层次信息。而语音转换技术是近年来语音信号处理领域的一个新分支,也是目前语音信号处理领域的一个研究热点。对语音转换技术的研究主要是以语音的个性特征信息为切入点展开的。语音转换技术就是对一个说话人的个性特征信息进行转变,并保持语义信息不变,使其变为另一个特定目标说话人的个性特征信息。对语音转换技术的研究有助于推动语音信号处理其它领域不断向前发展,甚至对目前比较热门的智能家居及人工智能领域的研究起到促进作用。其具有广阔的应用前景和巨大的理论研究价值。本文的主要工作如下:从语音产生模型入手,介绍了发音系统的数学模型及常用的语音特征参数。并对语音转换技术中的分析合成模型等基本理论进行了简要介绍。提出利用KLD将源和目标特征参数进行对齐的方法,该方法减少了查找源和目标空间之间最近邻域的搜索空间,也减少了计算量。重点研究了高斯混合模型以及矢量码本映射两种谱包络转换方法,分析了它们的优缺点。针对用GMM转换后语音的谱包络过于平滑的现象,研究了利用码本映射法对GMM转换函数中的均值项和相关项进行修正的方法,以此增大转换特征的离散程度,进而改善转换语音的质量。研究了基音频率变换方法。目前对基音频率的变换基本上都是对基音频率和声道谱参数分开进行建模的,这必然会影响转换后语音的音质。本文采用了基于径向基函数网络的基频变换算法。该方法用径向基函数网络在基音频率与声道谱参数之间建立联系。使得转换出的基频能够跟随目标基频起伏变化,并含有更多的目标说话人个性特征信息。对上述改进方法进行仿真测试,主观和客观测试结果都表明,改进的语音转换方法提高了转换语音的质量,得到了较好的转换效果。
【关键词】:语音转换 基音频率 高斯混合模型 谱包络转换
【学位授予单位】:西安建筑科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
  • 摘要3-5
  • Abstract5-9
  • 1 绪论9-15
  • 1.1 语音转换概述9
  • 1.2 语音转换的研究背景及意义9-10
  • 1.3 国内外研究进展10-12
  • 1.4 论文内容安排12-15
  • 2 语音转换技术基础15-27
  • 2.1 语音发音系统模型15-17
  • 2.1.1 语音的产生机理15-16
  • 2.1.2 语音发生系统的数学模型16-17
  • 2.2 语音转换基础技术17-25
  • 2.2.1 语音预处理17-19
  • 2.2.2 语音分析/合成模型19-22
  • 2.2.3 语音个性特征参数22-24
  • 2.2.4 语音信号的时间对齐24-25
  • 2.3 语音转换系统框架25
  • 2.4 本章小结25-27
  • 3 经典语音转换算法27-35
  • 3.1 频谱包络的转换方法27-32
  • 3.1.1 矢量码本映射法27-28
  • 3.1.2 说话人插值法28-29
  • 3.1.3 线性多变量回归法29
  • 3.1.4 人工神经网络转换方法29-30
  • 3.1.5 隐马尔可夫模型30-31
  • 3.1.6 高斯混合模型法31-32
  • 3.2 韵律特征的转换方法32-34
  • 3.2.1 基音频率的转换32-33
  • 3.2.2 时长的转换33
  • 3.2.3 能量的转换33-34
  • 3.3 语音合成与后处理34
  • 3.4 本章小结34-35
  • 4 基于GMM的语音转换方法及其改进35-45
  • 4.1 高斯混合模型35-37
  • 4.1.1 高斯混合模型的基本概念35
  • 4.1.2 高斯混合模型(GMM)的参数估计35-36
  • 4.1.3 高斯混合模型(GMM)转换算法36-37
  • 4.2 高斯混合模型过平滑问题的分析37-39
  • 4.3 改进的高斯混合模型算法39-42
  • 4.3.1 KLD散度39
  • 4.3.2 基于KLD的语音帧对齐39-41
  • 4.3.3 基于GMM和码本映射相结合的语音转换方法41-42
  • 4.4 联合谱包络的基频变换42-44
  • 4.4.1 径向基函数网络43-44
  • 4.4.2 基于RBF的联合变换法44
  • 4.5 本章小结44-45
  • 5 实验结果及其性能分析45-53
  • 5.1 实验的框架和任务45
  • 5.2 客观测试结果45-48
  • 5.3 主观测试结果48-53
  • 5.3.1 ABX测试49-50
  • 5.3.2 MOS测试50-53
  • 6 总结与展望53-55
  • 6.1 工作总结53-54
  • 6.2 研究展望54-55
  • 参考文献55-59
  • 攻读硕士期间主要研究成果59-61
  • 致谢61

【参考文献】

中国重要会议论文全文数据库 前1条

1 马建春;刘文举;;基于共振峰和高斯混合模型的声音转换系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年

中国硕士学位论文全文数据库 前1条

1 马瑞云;基于谱包络和超音段韵律的语音转换技术研究[D];南京邮电大学;2011年


  本文关键词:基于GMM和码本映射相结合的语音转换方法研究,,由笔耕文化传播整理发布。



本文编号:378489

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/378489.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户abae7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com