当前位置:主页 > 科技论文 > 网络通信论文 >

基于AHOcoder及GMM模型的语音转换研究

发布时间:2020-03-28 19:03
【摘要】:语音转换技术实现的是两个不同说话人声音个性特征之间的转换,即通过改变源语音的声学特征使之具有目标语音的声学特征,同时保留语义信息不变。语音转换技术可以提供个性化语音,用于文语转换终端,辅助医疗完善病人声音,丰富智能化人机交互等。另外,语音转换技术的研究有助于推动语音信号处理其它领域的不断发展,比如提高语音合成质量,降低说话人辨识难度等。所以,语音转换具有深远的应用前景和较大的理论研究价值。基于AHOcoder语音声码器及GMM模型的语音转换,主要工作如下:首先,从语音产生原理入手,描述发音系统的数学模型及常用的语音特征参数,分析特征参数对语音产生的影响,并对语音转换模型进行介绍。给出用于语音分解、特征参数提取与合成的AHOcoder语音声码器,该声码器可将语音信号分解并提取出对数基频、梅尔频率倒谱系数等参数并在转换之后基于特征参数进行语音合成。其次,重点研究基于AHOcoder语音声码器和GMM的语音转换系统。为了改善GMM造成的转换语音质量下降问题,加入双线性频率弯折训练,提高转换语音的质量。实验过程中发现时长不同会对语音转换效果造成一定的影响,于是利用均值方差法求出源语音与目标语音对应的时长调整因子,并结合时域叠加法对源语音时长进行调整,调整后的转换语音更接近目标语音。最后,针对GMM的过平滑现象进一步进行谱包络补偿,提出在GMM和双线性频率弯折训练的基础上加入全局方差的方法。仿真实验表明,谱包络补偿方法减小了转换语音与目标语音间的MFCC谱距离,改善了语音转换的效果,使得转换语音的质量进一步提高。
【图文】:

构造图,发音器官,构造图,语音转换


第2章 语音转换基础是以语音信号的产生模型为基础,对语音个性重构的过程。而语音信号模型的建立又是以说。所以研究语音转换系统的实现需要对基础的并分析影响语音个性特征的声学参数,,以及语模理节从肺部呼出的气流,通过发音器官作用后发过不同方式的作用,形成了不同声音。图 2-1
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3

【相似文献】

相关硕士学位论文 前1条

1 安洁;基于AHOcoder及GMM模型的语音转换研究[D];燕山大学;2018年



本文编号:2604785

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2604785.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户41291***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com