当前位置:主页 > 科技论文 > 网络通信论文 >

基于GMM和ANN混合模型的语音转换方法

发布时间:2018-12-23 21:07
【摘要】:为了克服利用高斯混合模型(Gaussian mixture model,GMM)进行语音转换的过程中出现的过平滑现象,考虑到GMM模型参数的均值能够表征转换特征的频谱包络形状,提出一种基于GMM与人工神经网络(Artificial neural network,ANN)混合模型的语音转换。该方法利用ANN对GMM模型参数的均值进行转换;为了获取连续的转换频谱,采用静态和动态频谱特征相结合来逼近转换频谱序列;鉴于基频对语音转换的重要性,在频谱转换的基础上,对基频也进行了分析和转换。最后,通过主观和客观实验对提出的混合模型的语音转换方法的性能进行测试。实验结果表明,与传统的基于GMM模型的语音转换方法相比,本文提出的方法能够获得更好的转换语音。
[Abstract]:In order to overcome the phenomenon of over-smoothing in the process of speech conversion using Gao Si mixed model (Gaussian mixture model,GMM), considering that the mean value of the parameters of GMM model can represent the spectrum envelope shape of the conversion feature. A speech conversion method based on GMM and artificial neural network (Artificial neural network,ANN) hybrid model is proposed. In this method, ANN is used to convert the mean value of GMM model parameters, and in order to obtain the continuous conversion spectrum, the static and dynamic spectrum features are combined to approximate the converted spectrum sequence. In view of the importance of fundamental frequency to speech conversion, the fundamental frequency is analyzed and converted on the basis of spectrum conversion. Finally, the performance of the proposed speech conversion method is tested by subjective and objective experiments. The experimental results show that the proposed method can achieve better speech conversion than the traditional speech conversion method based on GMM model.
【作者单位】: 南京邮电大学通信与信息工程学院;
【基金】:江苏省高校自然科学研究(13KJA510003)重大资助项目 江苏高校优势学科建设工程(PAPD)资助项目 江苏省普通高校研究生科研创新计划(CXLX12_0478,CXZZ13_0488)资助项目
【分类号】:TN912.3

【参考文献】

相关期刊论文 前2条

1 岳振军;邹翔;王浩;;基于隐马尔可夫模型和高斯混合模型结合的声音转换方法[J];数据采集与处理;2009年03期

2 孙健;张雄伟;曹铁勇;杨吉斌;孙新建;;基于卷积非负矩阵分解的语音转换方法[J];数据采集与处理;2013年02期

【共引文献】

相关期刊论文 前10条

1 马振;张雄伟;杨吉斌;徐玉龙;;基于稀疏卷积非负矩阵分解的语音转换方法研究[J];军事通信技术;2013年02期

2 宫朝辉;刁麓弘;;改进共振峰提取的语音端点检测[J];计算机辅助设计与图形学学报;2013年08期

3 XU Ning;BAO JingYi;LIU XiaoFeng;JIANG AiMing;TANG YiBing;;Voice conversion towards modeling dynamic characteristics using switching state space model[J];Science China(Information Sciences);2013年12期

4 赵建东;高光来;飞龙;;基于HMM的蒙古语语音合成技术研究[J];计算机科学;2014年01期

5 孙健;张雄伟;曹铁勇;杨吉斌;孙新建;;基于卷积非负矩阵分解的语音转换方法[J];数据采集与处理;2013年02期

6 孟凡博;吴志勇;蒙美玲;贾珈;蔡莲红;;基于决策树的英语焦点语音转换[J];清华大学学报(自然科学版);2013年07期

7 高新波;王笛;王秀美;;一种潜在信息约束的非负矩阵分解方法[J];数据采集与处理;2014年01期

8 张立伟;贾冲;张雄伟;闵刚;曾理;;稀疏卷积非负矩阵分解的语音增强算法[J];数据采集与处理;2014年02期

9 赵yN;张盛;林孝康;;一种改进的基音周期提取算法[J];数据采集与处理;2014年02期

10 马振;张雄伟;杨吉斌;;基于语音个人特征信息分离的语音转换方法研究[J];信号处理;2013年04期

相关会议论文 前2条

1 王海燕;杨鸿武;甘振业;裴东;;基于说话人自适应训练的汉藏双语语音合成[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

2 王朝民;谢湘;匡镜明;;一种嵌入式中文语音合成系统非周期成分音节层建模方法[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

相关博士学位论文 前1条

1 陈凌辉;说话人转换建模方法研究[D];中国科学技术大学;2013年

相关硕士学位论文 前7条

1 杨静;基于RTFI的钢琴音乐多基频估计[D];西南交通大学;2013年

2 杨曼;基于GMM和BP网络的语音转换系统设计[D];武汉理工大学;2013年

3 何彬;基于语音识别和语音合成的汉语语音转换技术研究[D];云南大学;2013年

4 任鹏辉;情感语音合成系统的研究与实现[D];太原理工大学;2013年

5 李冰洁;采用谱—韵律双变换的语音情感转换[D];苏州大学;2013年

6 孙广武;音素关联的多文种语音融合[D];湘潭大学;2013年

7 王红丽;基于FDA的语音基频建模的研究[D];西北师范大学;2013年

【二级参考文献】

相关期刊论文 前5条

1 左国玉,刘文举,阮晓钢;声音转换技术的研究与进展[J];电子学报;2004年07期

2 徐宁;杨震;张玲华;;基于状态空间模型的子频带语音转换算法[J];电子学报;2010年03期

3 双志伟;张世磊;秦勇;;语音转换分析及相似度改进[J];清华大学学报(自然科学版);2009年S1期

4 岳振军;邹翔;王浩;;基于隐马尔可夫模型和高斯混合模型结合的声音转换方法[J];数据采集与处理;2009年03期

5 李波,王成友,蔡宣平,张尔扬;LPC与LSF转换算法的比较研究[J];信号处理;2004年05期

【相似文献】

相关期刊论文 前10条

1 刘大鹏;尾关和彦;朱庆生;;添加音素持续时间信息到频谱模型的说话人辨认研究[J];计算机技术与发展;2007年05期

2 牛滨;孔令志;罗森林;潘丽敏;郭亮;;基于MFCC和GMM的个性音乐推荐模型[J];北京理工大学学报;2009年04期

3 陈俊;盛利元;;基于LSP线谱对参数的GMM说话人识别系统[J];微计算机信息;2010年04期

4 赵义正;;改进GMM谱包络转换性能的语音转换算法研究[J];科学技术与工程;2010年17期

5 曾秀花;杨鉴;徐永华;;语种辨识的多特征信息应用[J];计算机工程与应用;2010年25期

6 赵义正;;一种新的分维高斯混合模型语音转换方法[J];计算机与现代化;2010年09期

7 冯琦,周德云,侯明善;基于径向基函数神经网络的机载数字地图压缩方法[J];西北工业大学学报;2003年03期

8 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期

9 胡海清;张歆奕;;应用于说话人识别的AdaBoost GMM算法[J];五邑大学学报(自然科学版);2006年03期

10 杨辉;彭良玉;陆世专;;基于小波域高斯混合模型与中值滤波的图像去噪研究[J];电子技术应用;2007年05期

相关会议论文 前10条

1 应冬文;颜永红;付强;国雁萌;;基于约束高斯混合模型的噪声功率谱估计[A];2010年通信理论与信号处理学术年会论文集[C];2010年

2 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年

3 王莹;景新幸;杨海燕;;改进EM算法的高斯混合模型在说话人识别中的应用[A];2008年全国声学学术会议论文集[C];2008年

4 周洁;;基于高斯混合模型的情感语音转换[A];2011'中国西部声学学术交流会论文集[C];2011年

5 鲍福良;方志刚;徐洁;;基于MFCC和GMM的说话人确认研究[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

6 洪青阳;陈毅东;;一种用于说话人确认的区别性训练方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年

7 马建春;刘文举;;基于共振峰和高斯混合模型的声音转换系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年

8 李苇营;汤笑梅;易克初;胡征;;有限状态径向基函数网络结构在语音识别中的应用[A];第三届全国人机语音通讯学术会议论文集[C];1994年

9 康永国;双志伟;陶建华;张维;徐波;;高斯混合模型和码本映射相结合的语音转换算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年

10 石如亮;李弼程;王波;;语音编码对说话人识别系统的影响(英文)[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

相关博士学位论文 前10条

1 吕声;说话人转换方法的研究[D];华南理工大学;2004年

2 张原;基于高斯混合模型的无线传感器网络节点定位算法的研究[D];吉林大学;2010年

3 唐李军;Cubature卡尔曼滤波及其在导航中的应用研究[D];哈尔滨工程大学;2012年

4 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年

5 鄢田云;神经网络在语音质量客观评价应用中的研究[D];西南交通大学;2007年

6 陈淼;基于信号强度的WLAN室内定位跟踪系统研究[D];武汉大学;2012年

7 李强;分布源目标方位估计研究[D];西北工业大学;2007年

8 孙佳音;音乐要素自动分析关键技术研究[D];哈尔滨工业大学;2011年

9 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年

10 李新欣;船舶及鲸类声信号特征提取和分类识别研究[D];哈尔滨工程大学;2012年

相关硕士学位论文 前10条

1 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年

2 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年

3 姜可梅;检测代替分类的脑机接口研究[D];燕山大学;2011年

4 吴杰;基于高斯混合模型的话者识别系统的研究[D];吉林大学;2008年

5 吴华玉;抗噪声说话人识别技术研究[D];南京师范大学;2008年

6 丁国梁;耳语音说话人识别的研究[D];苏州大学;2009年

7 夏妍妍;基于RBF神经网络的语音识别方法的应用研究[D];大连海事大学;2008年

8 薛峰;说话人识别及其在噪声环境下的鲁棒性研究[D];苏州大学;2009年

9 辛全超;基于GMM的说话人语音识别研究与实践[D];华东师范大学;2010年

10 徐刚;基于泛布尔代数的说话人识别算法的研究[D];武汉理工大学;2006年



本文编号:2390261

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2390261.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4def6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com