基于码本映射和GMM的语音带宽扩展
本文选题:语音带宽扩展 切入点:高斯混合模型 出处:《北京理工大学学报》2017年09期 论文类型:期刊论文
【摘要】:采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象.
[Abstract]:When the traditional Gao Si hybrid model is used to extend the speech bandwidth, the estimated feature parameters will be too smooth. The main reason is the loss of the extended high-frequency feature details due to the inaccuracy of covariance estimation. Therefore, a speech bandwidth expansion algorithm based on codebook mapping and Gao Si hybrid model is proposed in this paper, which extracts the high and low frequency characteristic parameters, trains Gao Si mixed model, and trains the offset vector based on Gao Si mixed model parameters. In the extension phase, the low-frequency offset vector is mapped to the high-frequency offset vector by using the codebook of the offset vector. Then the high frequency offset vector and Gao Si mixed model are added together as the estimated high frequency characteristic parameters. The subjective / objective evaluation of the speech quality after bandwidth expansion is carried out by using this method. The experimental results show that, Compared with the traditional GMM speech bandwidth method, the high frequency speech synthesized by CM-GMM is closer to the original high frequency speech, and the phenomenon of high frequency over-smoothing is eliminated obviously.
【作者单位】: 北京理工大学信息与电子学院;
【基金】:国际合作研究项目
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 黄程韦;赵艳;金峗;于寅骅;赵力;;实用语音情感的特征分析与识别的研究[J];电子与信息学报;2011年01期
2 刘骁,张海燕,刘镇清;一种变速语音音调复原的处理方法[J];电声技术;2000年07期
3 岳振军;宋巍;王浩;张雄伟;;基于傅立叶-贝塞尔展开的语音转换算法[J];信号处理;2008年02期
4 林晓丹;王佳斌;;多特征联合的语音被动取证方法[J];微型机与应用;2012年20期
5 汤敏,曾毓敏,谭锡林;多带激励语音编码器仿真实现[J];南京师范大学学报(工程技术版);2005年01期
6 王磊;李忠强;孙自力;杨阳;;语音数字化及其评价方法分析[J];电声技术;2007年10期
7 李燕诚;崔慧娟;唐昆;;基于似然比测试的语音激活检测算法[J];计算机工程;2009年10期
8 虞晓,胡光锐,徐雄;采用聚类神经网络与分离输出语音重构的语音分离算法[J];上海交通大学学报;2000年06期
9 陈国,胡修林,张蕴玉;基于质量评价技术的多信道语音选优决策系统[J];系统工程与电子技术;2000年10期
10 陈亮,张雄伟;基于分形维数实现语音分割和增强[J];北京邮电大学学报;2003年S1期
相关会议论文 前7条
1 张红兵;;混响对语音鉴定影响的研究[A];运输噪声的预测与控制——2009全国环境声学学术会议论文集[C];2009年
2 徐近霈;刘明宝;杨子云;;高噪环境下顽健语音特征抽取[A];第三届全国人机语音通讯学术会议论文集[C];1994年
3 陈俊;孙洪;姜琳峰;;基于语音检测的回声抑制[A];武汉市首届学术年会通信学会2004年学术年会论文集[C];2004年
4 吴超;杨震;;一种采用高频正弦模型的宽带语音编码器[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
5 姚艳军;景新幸;;一种基于STRAIGHT模型的语音转换方法[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
6 岳振军;王浩;张雄伟;;基于正弦谐波模型和BP神经网络的语音变换算法及实现[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
7 刘亚斌;李爱军;;朗读语料与自然口语的差异分析[A];第六届全国人机语音通讯学术会议论文集[C];2001年
,本文编号:1647938
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1647938.html