当前位置:主页 > 科技论文 > 网络通信论文 >

低信噪比环境下语音增强及相关技术研究

发布时间:2020-08-28 18:29
   语音是人与人之间最直接、最便捷的交流方式,噪声的存在降低了语音信号的清晰度和可懂度,影响了人们的正常交流。在低信噪比环境下,噪声的干扰给语音信号处理带来很大困难。因此,低信噪比环境下,人们需要更优良的语音增强技术对含噪语音进行降噪,以便后续进行高效的语音识别等处理。因此研究低信噪比环境下的语音增强技术具有重要的理论意义和实际价值。本文的研究目标是在低信噪比环境下降低噪声对语音的干扰,提升语音增强的效果。为此,本文首先从语音端点检测出发,提出了一种基于MFCC倒谱距离的自适应语音端点检测方法。接着基于精准的端点检测,针对维纳滤波语音增强算法由于端点检测不准确导致增强效果不佳的问题,对检测环节进行了改进,提升了增强效果。为了解决更复杂噪声下的去噪问题,文章最后研究了基于深度神经网络的语音增强技术。本文所做的工作和创新如下:(1)通过对语音增强技术发展进程的调研,我们了解了语音增强技术的发展近况及其相关的语音处理技术。重点对语音端点检测技术做了一定的研究和调研工作,介绍了多种常用的语音端点检测方法并将他们逐个实现以便用于后期的比较。另外,详述了谱减法、维纳滤波法和神经网络语音增强法的模型框架和实现过程。(2)针对传统语音端点检测算法在恶劣噪声环境下难以保证检测精度的问题,本文提出了一种基于MFCC倒谱距离的结合多窗谱估计的自适应端点检测方法。在语音检测阶段,首先计算各帧与无话帧之间的MFCC倒谱距离,以此为特征,选取合适的阈值来进行判决。该阈值与前导无话帧的MFCC系数和噪声的平均MFCC系数之间的差值密切相关,该算法可以在不同的噪声环境中自适应的调整阈值,从而提高了语音端点检测精度。实验数据表明,该端点检测方法和其他常用检测算法相比,在低信噪比环境下仍具有较高的端点检测率,对噪声具有强的鲁棒性。(3)针对传统维纳滤波语音增强算法由于端点检测不够精准导致噪声估计不精确从而最终影响语音增强质量的问题,本文采用基于MFCC倒谱距离的自适应端点检测方法来对维纳滤波增强算法的噪声段进行准确估计。实验表明,改进后的算法能够提高增强语音的质量。(4)针对上述方法在非平稳噪声低信噪比下效果欠佳的问题,我们搭建了神经网络语音增强系统,取得了不错的语音增强效果。接下来利用维纳滤波语音增强算法对训练及测试语音进行预增强后再送入神经网络进行训练和测试,即将两种语音增强方法结合,进一步提升了复杂噪声环境低信噪比下的语音增强效果。
【学位单位】:南京邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TN912.3
【部分图文】:

发生机理,语音,声道,鼻腔


究生学位论文 第二章 语的差异导致的。第三个部门叫调音区,就是对已经产生的声嘴唇、牙齿、鼻腔等来完成。我们能分别不同人说话是因为话内容以及前鼻音、后鼻音包括辅音等都是经由这个区域完的口腔和鼻腔即声道发出,我们把这个声道叫做声学共振腔实是经过多个器官共同协作来完成的。

听觉系统


图 2.3 人耳的听觉系统图人耳中,都可以用这三个要素来进行衡量:音色、音调和响受,它是由振幅决定的。人耳对音强的感知范围是 10-16~102者粗的一种感受,人耳能够听到的声音的振动频率是 20Hz~,是每个发声的事物最具个性的属性,我们可以根据音色来的研究成果,以下是一些针对人耳特性的研究结论:首先,位不敏感。人耳具有很强的听辨能力,我们时常在一个两人某个人的声音,这个现象俗称 鸡尾酒效应[41]。比方说,在听某一种声音,他可以做到对周围的其他噪声充耳不闻,但名字时会立即引起他的注意。具体来说,就是指人的耳朵可能够无视除此之外的其他声音但也自动地监视着这些外界声种刺激,能马上做出反应。它与人耳的双耳输入效应有关,

谱图,矩形窗,和频,时域波形


( ) ( ) ( )ws n s n w n号处理领域,使用的窗函数有很多种,目前来说主要有矩形窗、汉明窗、布莱克曼窗等,其中矩形窗、汉明窗和汉宁窗使用的最多。矩形窗窗函数的时域可以表示成下列形式:1, 0 ( 1)( )0,n Nw n 其他可以表示为:1( )2sin( )2( )sin( )2Nj Tj TRNTW e eT 时域波形图和频谱图如图 2.6 所示。

【参考文献】

相关期刊论文 前10条

1 沈晓园;聂红亮;赵硕;;浅谈电气自动化控制中的人工智能技术[J];化工管理;2015年30期

2 乔宽;杨中豪;;基于深度神经网络的语音增强研究[J];广东通信技术;2015年06期

3 张守斌;魏峻山;胡世祥;高锋亮;秦承华;王洪燕;刘砚华;;中国环境噪声污染防治现状及建议[J];中国环境监测;2015年03期

4 孙志军;薛磊;许阳明;王正;;深度学习研究综述[J];计算机应用研究;2012年08期

5 孙林慧;杨震;;基于数据驱动字典和稀疏表示的语音增强[J];信号处理;2011年12期

6 曹梅双;曾庆宁;陈芙蓉;;一种基于广义奇异值分解的语音增强算法[J];微电子学与计算机;2010年03期

7 李如玮;鲍长春;窦慧晶;;基于双正交小波包分解的自适应阈值语音增强[J];仪器仪表学报;2008年10期

8 何渊淘;邓伟;;多层感知器三种学习算法的比较[J];苏州大学学报(工科版);2008年01期

9 唐永锋;霍春宝;;噪声环境下语音信号端点检测算法的研究与改进[J];电脑知识与技术(学术交流);2007年11期

10 武光利;戴玉刚;马宁;;基于短时平均幅度和短时平均过零率的藏语语音端点检测研究[J];福建电脑;2007年03期



本文编号:2807979

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2807979.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a49a0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com