当前位置:主页 > 科技论文 > 网络通信论文 >

倒谱本征空间结构化高斯混合模型语音转换方法

发布时间:2019-01-24 22:14
【摘要】:针对非平行语料非联合训练条件下的语音转换,提出一种基于倒谱本征空间结构化高斯混合模型的方法。提取说话人语音倒谱特征参数之后,根据其散布矩阵计算本征向量构造倒谱本征空间并训练结构化高斯混合模型SGMM-ES(Structured Gaussian Mixture Model in Eigen Space)。源和目标说话人各自独立训练的SGMM-ES根据全局声学结构AUS(Acoustical Universal Structure)原理进行匹配对准,最终得到基于倒谱本征空间的短时谱转换函数。实验结果表明,转换语音的目标说话人平均识别率达到95.25%,平均谱失真度为1.25,相对基于原始倒谱特征空间的SGMM方法分别提高了0.8%和7.3%,而ABX和MOS测评表明转换性能非常接近于传统平行语料方法。这一结果说明采用倒谱本征空间结构化高斯混合模型进行非平行语料条件下的语音转换是有效的。
[Abstract]:In this paper, a hybrid model of Gao Si based on cepstrum eigenspace is proposed for speech conversion under the condition of non-parallel corpus non-joint training. After extracting the speech Cepstrum characteristic parameters of the speaker, the eigenvector is calculated according to its scatter matrix to construct the cepstrum eigenspace and train the structured Gao Si mixed model SGMM-ES (Structured Gaussian Mixture Model in Eigen Space). The SGMM-ES trained independently by the source and the target speaker is matched and aligned according to the AUS (Acoustical Universal Structure) principle of the global acoustic structure. Finally, the short-time spectral transformation function based on the cepstrum eigenspace is obtained. The experimental results show that the average recognition rate of target speaker is 95.25 and the average spectral distortion is 1.25. Compared with the SGMM method based on original cepstrum feature space, the average recognition rate of target speaker is increased by 0.8% and 7.3%, respectively. ABX and MOS evaluation show that the conversion performance is very close to the traditional parallel corpus method. The results show that the use of cepstrum eigenspace structured Gao Si mixed model for speech conversion under the condition of non-parallel corpus is effective.
【作者单位】: 苏州大学电子信息学院;
【基金】:国家自然科学基金(61271360) 苏州市应用基础研究计划(SYG201230)资助
【分类号】:TN912.3

【参考文献】

相关期刊论文 前3条

1 康永国;双志伟;陶建华;张维;;基于混合映射模型的语音转换算法研究[J];声学学报;2006年06期

2 陈雪勤;赵鹤鸣;;有效高斯分量通用背景模型下耳语音声道系统转换研究[J];声学学报;2013年02期

3 俞一彪;曾道建;姜莹;;采用独立说话人模型的语音转换[J];声学学报;2012年03期

【共引文献】

相关期刊论文 前9条

1 赵义正;;一种新的分维高斯混合模型语音转换方法[J];计算机与现代化;2010年09期

2 赵义正;;改进GMM谱包络转换性能的语音转换算法研究[J];科学技术与工程;2010年17期

3 李燕萍;张玲华;丁辉;;基于音素分类的汉语语声转换算法[J];南京邮电大学学报(自然科学版);2011年01期

4 CHEN Xueqin;ZHAO Heming;;Research of whispered speech vocal tract system conversion based on universal background model and effective Gaussian components[J];Chinese Journal of Acoustics;2013年04期

5 JIAN Zhihua;WANG Xiangwen;;A modified voice conversion algorithm using compressed sensing[J];Chinese Journal of Acoustics;2014年03期

6 赵义正;;一种改进高斯混合模型均值项的语音转换方法[J];微型机与应用;2012年19期

7 陈雪勤;赵鹤鸣;;有效高斯分量通用背景模型下耳语音声道系统转换研究[J];声学学报;2013年02期

8 解伟超;张玲华;;基于自组织聚类和改进粒子群算法的语音转换方法[J];声学学报;2014年01期

9 简志华;王向文;;采用压缩感知的改进的语音转换算法[J];声学学报;2014年03期

相关硕士学位论文 前8条

1 张林林;汉语语文转换中NHMM算法和音库词库设计的研究[D];西南交通大学;2011年

2 杨阳;汉语语音转换系统的研究[D];北京交通大学;2008年

3 袁晓勇;基于LPAC-PSOLA合成算法语音转换系统[D];哈尔滨工程大学;2009年

4 童波;特定对象汉语语音转换系统的研究[D];华北电力大学(北京);2010年

5 李力;采用超音段韵律特征联合短时频谱的语音转换[D];苏州大学;2012年

6 解伟超;语音转换中声道谱参数和基频变换算法的研究[D];南京邮电大学;2013年

7 朱春雷;优化自适应非平行训练语音转换算法研究[D];苏州大学;2013年

8 李阳春;倒谱本征空间结构化高斯混合模型及语音转换研究[D];苏州大学;2014年

【二级参考文献】

相关期刊论文 前5条

1 左国玉,刘文举,阮晓钢;声音转换技术的研究与进展[J];电子学报;2004年07期

2 张焱,姜惠春,黄志同;隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究[J];声学学报;1998年06期

3 李淑红,桑恩方;基于小波变换和矢量量化的语音压缩编码方案[J];声学学报;2000年01期

4 康永国;双志伟;陶建华;张维;;基于混合映射模型的语音转换算法研究[J];声学学报;2006年06期

5 王敏;赵鹤鸣;;基于多带解调分析和瞬时频率估计的耳语音话者识别[J];声学学报;2010年04期

【相似文献】

相关期刊论文 前10条

1 李全彬;黄昶;;基于本征空间的多姿态人脸识别方法[J];现代电子技术;2009年01期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相关硕士学位论文 前1条

1 李阳春;倒谱本征空间结构化高斯混合模型及语音转换研究[D];苏州大学;2014年



本文编号:2414912

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2414912.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1ee1f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com