基于非负矩阵分解与时频掩蔽估计的语音增强技术研究

发布时间：2021-09-09 11:30

　　随着人们对移动电话和IP电话持续增长的需求,对语音编解码器的性能要求也日益提高。然而,在通信过程中会受到各种噪声的干扰,大大地影响了通信质量和可懂度。其中,语音增强作为语音编解码器的核心技术,决定了编解码器性能的好坏。因此,本论文试图研究一套在低信噪比以及非平稳噪声环境下均适合的语音增强方案并将其应用在增强型语音服务（Enhanced Voice Services,EVS）编解码器中。本论文的研究工作主要围绕非负矩阵分解与时频掩蔽估计两种方法进行介绍,分别包括以下三方面内容:首先,针对非负矩阵分解方法不能准确估计语音基矩阵和噪声基矩阵而导致过多的残留噪声,且时频掩蔽估计方法中高频区语音能量较低且等效带宽较宽,分辨率低而导致高频部分语音失真严重的问题,提出了一种融合非负矩阵分解与听觉域下时频掩蔽估计的语音增强方法。该方法首先在线下分别训练语音和噪声的基矩阵,结合从含噪语音在线估计出的编码矩阵来构建维纳滤波器,并转换成Gammatone域（也称为听觉域）下理想比值掩蔽估计的形式,然后在线上增强阶段结合自身的时频掩蔽估计,形成一种新的语音增强算法。经实验测试表明,所提算法的性能均优于参考方法...

【文章来源】：北京工业大学北京市 211工程院校

【文章页数】：93 页

【学位级别】：硕士

【图文】：

人耳结构示意图

基于非负矩阵分解与时频掩蔽估计的语音增强技术研究

耳蜗结构示意图

基于非负矩阵分解与时频掩蔽估计的语音增强技术研究

所提方法原理框图

【参考文献】：
期刊论文
[1]罗德与施瓦茨公司EVS测试方案[J]. 陈博.  电信网技术. 2017(10)
[2]EVS音频编码器标准介绍[J]. 洪英杰.  电脑编程技巧与维护. 2015(16)
[3]一种基于计算听觉场景分析的语音增强算法[J]. 张卫强,郭璁,张乔,康健,何亮,刘加,Johnson Michael T.  天津大学学报(自然科学与工程技术版). 2015(08)
[4]宽带语音编码技术专题讲座（一）第2讲宽带嵌入式可变速率语音和音频编解码器:ITU-T G.718[J]. 郑国宏,陈亮,王金明,尹廷辉.  军事通信技术. 2011(02)

博士论文
[1]基于计算听觉场景分析的单声道语音分离研究[D]. 赵立恒.中国科学技术大学 2012

硕士论文
[1]语音/音频混合编码器中的信号分类算法研究[D]. 杨万钊.武汉大学 2018
[2]EVS音频流无参考客观质量评估研究[D]. 李素华.西安电子科技大学 2017
[3]基于双耳线索的单通道语音增强方法[D]. 陈楠.北京工业大学 2017
[4]自回归模型驱动的语音增强算法研究[D]. 何奇.北京工业大学 2016

本文编号：3392012

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3392012.html

上一篇：超宽带/多频带天线与高隔离度MIMO天线的研究
下一篇：基于子阵的FDA-MIMO雷达去栅瓣方法

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|