当前位置:主页 > 科技论文 > 信息工程论文 >

基于改进的GMM和频率弯折的高质量语音转换算法的研究

发布时间:2020-03-15 09:32
【摘要】:语音是说话人发音时产生的信号,其包含语义信息、个性信息和情绪等多种自然信息,具有采集友好且方便的特点。语音转换技术就是对源说话人的个性特征参数进行转变,使其具有目标说话人的个性特征信息,并保持语音的语义信息不变。作为近年来说话人识别和语音合成技术高度发展后的延伸和拓展,语音转换技术受到国内外语音研究者的高度关注。随着语音转换技术的发展,语音研究者不再仅仅关注转换语音的可懂度和转换后的相似度,而更加强调转换语音音质的流畅性、自然度。对语音转换技术的研究有助于推动语音信号处理其他领域不断向前发展,可以作为医疗辅助,提高语音的质量,也可以丰富大数据处理和智能化人机交互,使人机交互更加自然,具有娱乐性和个性化。因此,对语音转换的研究其应用前景深远、理论研究价值巨大。本文针对语音转换技术开展了研究,主要研究内容如下:从语音产生原理入手,介绍了发音系统的数学模型及常用的语音特征参数,并对语音转换模型进行了简要介绍。本文中用于特征参数提取与合成的模型是AHOcoder模型,该模型可以同时提取出0log f、MFCC(梅尔倒谱参数)以及浊音最大频率。详细描述了GMM-双线性频率弯折加幅度压扩语音转换模型,分析了GMM的训练、双线性频率弯折加幅度压扩训练、转换流程及相关方面的理论知识。通过Matlab实验,对该模型与传统GMM模型、GMM-双线性频率弯折模型进行了主客观性能的比较,在这几种模型中该模型转换语音效果最优。重点研究了改进的GMM-频率弯折的语音转换模型。针对GMM模型中混合数固定,语音特征参数分类不合理的问题,在基于高斯混合模型的聚类过程中引入了迭代自组织聚类算法ISODATA,该算法具有较好的聚类特性,以此来得到更符合说话人个性特征参数的分类,进而改善转换语音的质量。迭代自组织聚类算法使用误差平方和作为聚类准则,设置初始值参数对“合并”和“分裂”操作进行判断,并根据拟合数据的分布,自调节得到最优类别数。这一聚类比传统GMM的K-Means聚类具有自组织的优势。经过迭代自组织聚类后再进行EM迭代,结合后续的双线性频率弯折实现语音转换。通过实验分析,该模型在客观评价方面,MCD值比GMM-双线性频率弯折加幅度压扩模型的低,在不同语料、不同转换情形下MCD值平均下降了1.49%,反映了该模型频谱的失真程度更低,转换语音与目标语音的频谱相似性更好;在主观评价方面MOS值比GMM-双线性频率弯折加幅度压扩模型的高,MOS值平均提高了5.13%,表明该模型转换语音的音质更优。理论分析和实验证明,该模型与GMM-双线性频率弯折加幅度压扩模型相比,转换后的频谱相似度和MOS值都更高,这表明该模型在个性相似性和合成语音音质方面都有一定性能的改进,实现了高质量的语音转换。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3

【参考文献】

相关期刊论文 前9条

1 王民;苏利博;王稚慧;要趁红;;采用STRAIGHT模型和深度信念网络的语音转换方法[J];计算机工程与科学;2016年09期

2 王坚;张媛媛;;基于深度神经网络的汉语语音合成的研究[J];计算机科学;2015年S1期

3 简志华;王向文;;采用压缩感知的改进的语音转换算法[J];声学学报;2014年03期

4 李燕萍;张玲华;丁辉;;基于音素分类的汉语语声转换算法[J];南京邮电大学学报(自然科学版);2011年01期

5 简志华;杨震;;基于维特比算法的语声转换[J];电子学报;2009年07期

6 申毅;简志华;杨震;;改进的GMM模型语声转换系统[J];南京邮电大学学报(自然科学版);2007年05期

7 简志华;杨震;;基于混合线性变换的语声转换算法[J];电子与信息学报;2007年07期

8 李波,王成友,蔡宣平,唐朝京,张尔扬;语音转换及相关技术综述[J];通信学报;2004年05期

9 吴宗济;普通话元音和辅音的频谱分析及共振\锏牟馑鉡J];声学学报;1964年01期

相关博士学位论文 前1条

1 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年

相关硕士学位论文 前10条

1 李金中;多参数驱动的年龄语音转换系统[D];中国科学技术大学;2015年

2 刘利娟;声音转换的神经网络建模方法研究[D];中国科学技术大学;2015年

3 李健;基于GMM的汉语语音转换系统研究[D];云南大学;2015年

4 李阳春;倒谱本征空间结构化高斯混合模型及语音转换研究[D];苏州大学;2014年

5 毕兴;基于频率规整的语音转换技术研究[D];国防科学技术大学;2013年

6 朱春雷;优化自适应非平行训练语音转换算法研究[D];苏州大学;2013年

7 吴丽芳;语音转换系统中特征参数的研究[D];南京邮电大学;2013年

8 李冰洁;采用谱—韵律双变换的语音情感转换[D];苏州大学;2013年

9 杨曼;基于GMM和BP网络的语音转换系统设计[D];武汉理工大学;2013年

10 赵玲丽;基于高斯混合模型的语音转换技术研究[D];南京邮电大学;2011年



本文编号:2587165

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2587165.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cc934***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com