面向语音增强的约束序贯高斯混合模型噪声功率谱估计
本文选题:高斯混合模型 + 功率谱估计 ; 参考:《声学学报》2017年05期
【摘要】:提出了一种基于极大似然的噪声对数功率谱估计方法,采用高斯混合模型对每一个频带上的功率谱包络构建统计模型,将时序包络划分为语音和非语音类,它们分别对应于高斯混合模型的两个高斯分量,描述语音和非语音的统计分布,其中非语音高斯分量的均值即为噪声功率谱的最优估计.采用序贯学习的方法,在极大似然准则下逐帧更新模型参数,并逐帧给出噪声功率谱的最优估计值。此外,由于序贯更新过程中语音信号长时缺失,容易导致模型失稳,提出了一种在线的最小描述长度准则(MDL)来判断语音信号是否长时缺失,从而保证了模型的稳定性.实验表明,算法性能整体优于经典的MS和IMCRA算法。
[Abstract]:In this paper, a noise logarithmic power spectrum estimation method based on maximum likelihood is proposed. The Gao Si hybrid model is used to construct a statistical model for the power spectrum envelope in each frequency band, and the time series envelope is divided into speech and non-speech classes. They correspond to two Gao Si components of Gao Si mixed model, and describe the statistical distribution of speech and non-speech. The mean value of non-speech Gao Si component is the optimal estimation of noise power spectrum. Using sequential learning method, the model parameters are updated frame by frame under the maximum likelihood criterion, and the optimal estimation of noise power spectrum is given. In addition, due to the long time loss of speech signal in sequential updating process, it is easy to lead to model instability. An online minimum description length criterion (MDL) is proposed to judge whether the speech signal is long time missing or not, so as to ensure the stability of the model. Experiments show that the performance of the algorithm is better than that of the classical MS and IMCRA algorithms.
【作者单位】: 江西理工大学信息工程学院;北京理工大学多元信息系统实验室;中国科学院声学研究所语言声学与内容理解重点实验室;国家计算机网络应急技术处理协调中心;
【基金】:江西省教育厅科技项目(GJJ150681) 江西理工大学自然科学基金项目(NSFJ2015-G21) 国家重点基础研究发展计划项目(2013CB329302) 国家自然科学基金项目(61271426,10925419,90920302,61072124,11074275,11161140319,91120001) 中国科学院战略性先导科技专项(XDA06030100,XDA06030500);中国科学院重点部署项目(KGZD-EW-103-2)资助
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 翟继友;张鹏;;高斯混合模型参数估值算法的优化[J];计算机技术与发展;2011年11期
2 王晓晨;姜林;;一种基于高斯混合模型的导谱频率参数量化算法[J];电视技术;2014年15期
3 郑华;裴承鸣;秦淋;;基于高斯混合模型的粒子滤波时频分析算法[J];测控技术;2011年03期
4 崔玮;吴成东;张云洲;贾子熙;程龙;;基于高斯混合模型的非视距定位算法[J];通信学报;2014年01期
5 林琳;王树勋;魏小丽;;基于遗传模糊高斯混合模型的训练方法[J];吉林大学学报(工学版);2006年06期
6 张琦;王霞;孙焘;;高斯混合模型下的残留回波抑制算法[J];西安交通大学学报;2013年04期
7 余清清;李应;李勇;;基于高斯混合模型的自然环境声音的识别[J];计算机工程与应用;2011年25期
8 石锐;王博;何庆华;;基于高斯混合模型的咳嗽音检测方法[J];计算机工程与应用;2011年32期
9 夏玉果;顾明亮;;基于聚类支持矢量机的汉语方言辨识[J];计算机与数字工程;2012年05期
10 张文英;郭兴明;翁渐;;改进的高斯混合模型在心音信号分类识别中应用[J];振动与冲击;2014年06期
相关会议论文 前3条
1 康永国;双志伟;陶建华;张维;徐波;;高斯混合模型和码本映射相结合的语音转换算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
2 应冬文;颜永红;付强;国雁萌;;基于约束高斯混合模型的噪声功率谱估计[A];2010年通信理论与信号处理学术年会论文集[C];2010年
3 周洁;;基于高斯混合模型的情感语音转换[A];2011'中国西部声学学术交流会论文集[C];2011年
相关硕士学位论文 前10条
1 车滢霞;约束条件下的结构化统计声学模型及非平行语料语音转换[D];苏州大学;2015年
2 姚绍芹;基于声道谱参数的语音转换算法研究[D];南京邮电大学;2015年
3 蔡超;自动语种识别的研究与应用[D];电子科技大学;2016年
4 蔡桂林;高斯混合模型用于语音情感识别研究[D];广西师范大学;2016年
5 闫昊;基于高斯混合模型的文本无关说话人年龄识别[D];苏州大学;2015年
6 于莹莹;基于高斯混合模型的频带扩展算法的研究[D];北京理工大学;2015年
7 贾楠;基于流形及高斯混合模型的压缩感知算法研究[D];燕山大学;2013年
8 孙峰;基于高斯混合模型的语种识别技术[D];哈尔滨工程大学;2006年
9 吴杰;基于高斯混合模型的话者识别系统的研究[D];吉林大学;2008年
10 魏开容;高斯混合模型FPGA实现关键技术研究[D];解放军信息工程大学;2011年
,本文编号:2096711
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2096711.html