当前位置:主页 > 科技论文 > 信息工程论文 >

基于深度神经网络的语音增强算法研究

发布时间:2017-04-24 00:01

  本文关键词:基于深度神经网络的语音增强算法研究,由笔耕文化传播整理发布。


【摘要】:科技进步日新月异的今天,语音正逐步成为人机交互中的一种重要通道。然而在现实生活环境中,语音信号非常容易受到各种噪声的影响,从而导致人机交互的延时问题和错误识别问题。因此语音增强技术就显得尤为重要,此技术就是消除语音信号中的噪声,提升语音信号的性能,使得语音具有较高的清晰度、可理解度和流畅度。本文主要研究谱减法与深度神经网络语音增强算法。谱减法是一种经典的语音增强算法,此算法实现较简单,且容易理解,但是增强后的语音有残留噪声,一般称为音乐噪声。这种噪声比较难以去除,为了解决这个问题。本文使用深度神经网络进行语音增强研究。深度神经网络语音增强算法就是利用带噪语音信号对网络进行训练,使得网络具有抗噪声的能力,从而实现语音增强的目的。在训练过程中一般采用BP算法,但是随着网络隐含层数的增加,训练过程中容易出现局部最优问题和过拟合问题。因此,本文采用的是逐层贪婪无监督训练算法,将整个训练过程分成无监督训练和有监督训练两个过程。在网络训练过程中还有一个重要的参数就是网络的隐含层数,它与网络的训练效果有着直接的关系。本文提出了偏差法来设置网络的隐含层数,对网络适合隐含层数的设置进行了一定的理论推导,同时在实验中对其进行了验证。但是深度神经网络语音增强算法对于训练库的要求比较高,训练时间长。为了解决这个问题,本文提出了谱减法与深度神经网络结合的语音增强算法。谱减法与深度神经网络结合的语音增强算法解决了深度神经网络语音增强算法中训练库要求噪声种类多的问题,同时也在一定程度上提升了语音增强效果。实验证明,此结合算法的效果优于谱减法的其他结合算法。本文提出了偏差法来设置深度神经网络的隐含层数,同时,本文还提出了谱减法与深度神经网络结合的语音增强算法。最后,本文的实验对上述方法进行了验证,实验结果表明这些方法是行之有效的,而且深度神经网络语音增强算法具有很好的语音增强效果。
【关键词】:语音增强 深度神经网络 谱减法 偏差法 隐含层数
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3;TP183
【目录】:
  • 摘要5-7
  • Abstract7-11
  • 第一章 绪论11-17
  • 1.1 语音增强研究的目的和意义11
  • 1.2 语音增强的研究历史和现状11-14
  • 1.3 本文的研究目标与研究内容14-15
  • 1.4 本文的章节安排15-16
  • 1.5 本章小结16-17
  • 第二章 语音增强的基础理论17-32
  • 2.1 噪声信号的分类17-18
  • 2.2 语音信号的预处理18-22
  • 2.2.1 预加重18
  • 2.2.2 分帧加窗18-20
  • 2.2.3 语音端点检测20-22
  • 2.3 谱减法22-27
  • 2.3.1 基本谱减法22-24
  • 2.3.2 改进的谱减法24-25
  • 2.3.3 减少音乐噪声25-27
  • 2.4 语音增强质量评估27-31
  • 2.4.1 主观评价27-28
  • 2.4.2 客观评价28-31
  • 2.5 本章小结31-32
  • 第三章 深度神经网络的基础理论32-39
  • 3.1 深度神经网络32-33
  • 3.2 受限玻尔兹曼机33-34
  • 3.3 能量函数和概率分布34-36
  • 3.4 对比散度算法36-37
  • 3.5 深度神经网络的训练37-38
  • 3.6 本章小结38-39
  • 第四章 深度神经网络语音增强39-48
  • 4.1 深度神经网络语音增强结构39-40
  • 4.2 偏差法设置隐含层数40-42
  • 4.3 语音增强系统的训练42-46
  • 4.4 谱减法与深度神经网络的结合46-47
  • 4.5 本章小结47-48
  • 第五章 实验设计与实验结果的分析48-59
  • 5.1 语音数据库48
  • 5.2 语音增强评价指标48-49
  • 5.3 谱减法实验结果49-50
  • 5.4 深度神经网络语音增强实验50-55
  • 5.4.1 隐含层数的设置51-52
  • 5.4.2 噪声类型的数目52-53
  • 5.4.3 输入信号的上下文长度53-54
  • 5.4.4 深度神经网络语音增强系统54-55
  • 5.5 谱减法与深度神经网络结合算法55-58
  • 5.6 本章小结58-59
  • 第六章 总结与展望59-61
  • 6.1 论文总结59-60
  • 6.2 未来研究的展望60-61
  • 致谢61-62
  • 参考文献62-67
  • 攻读硕士学位期间发表的论文67-68

【相似文献】

中国期刊全文数据库 前10条

1 胡光锐,虞晓;基于二阶前向结构和信息最大理论的语音增强算法[J];上海交通大学学报;2000年07期

2 姚峰英,张敏;用于语音增强的高频信噪比度量[J];声学学报;2002年05期

3 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期

4 王金明,张雄伟;一种基于自适应模糊滤波的语音增强方法[J];解放军理工大学学报(自然科学版);2003年01期

5 杨汇军,郑海英,王立红;语音增强方法的研究[J];辽宁工学院学报;2003年05期

6 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期

7 孙新德;一种改进的语音增强方法及实现[J];郑州航空工业管理学院学报(社会科学版);2005年04期

8 钱国青;赵鹤鸣;;基于改进谱减算法的语音增强新方法[J];计算机工程与应用;2005年35期

9 王晶,傅丰林,张运伟;语音增强算法综述[J];声学与电子工程;2005年01期

10 杨毅;杨宇;余达太;;语音增强及其消噪能力研究[J];微电子学与计算机;2006年07期

中国重要会议论文全文数据库 前10条

1 陈凯;俞蒙槐;胡上序;付强;;语音增强系统性能评测方法综述[A];第四届全国人机语音通讯学术会议论文集[C];1996年

2 王建波;林本浩;田春明;刘睿;;语音增强及其相关技术研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年

3 徐舒;孙洪;;基于融合迭代的语音增强方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

4 牛刚;任新智;吴国庆;;谐波能量汇集度在语音增强中的应用[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

5 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

6 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

7 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

8 刘淑华;胡强;覃团发;万海斌;;语音增强算法的研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年

9 魏臻;张景达;陆阳;;嵌入式系统中语音增强改进算法的研究[A];2007'中国仪器仪表与测控技术交流大会论文集(一)[C];2007年

10 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

中国博士学位论文全文数据库 前10条

1 欧世峰;变换域语音增强算法的研究[D];吉林大学;2008年

2 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年

3 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年

4 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年

5 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

6 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年

7 徐勇;基于深层神经网络的语音增强方法研究[D];中国科学技术大学;2015年

8 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年

9 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年

10 赵彦平;基于稀疏表示的语音增强方法研究[D];吉林大学;2014年

中国硕士学位论文全文数据库 前10条

1 肖佩霖;双通道语音增强系统设计与实现[D];哈尔滨工业大学;2011年

2 陈成斌;针对于家居环境的语音增强系统的研究与开发[D];华南理工大学;2015年

3 魏有权;基于噪声估计的语音增强算法研究[D];昆明理工大学;2015年

4 胡勇;麦克风阵列语音增强算法研究[D];电子科技大学;2014年

5 曹后斌;有色背景噪声环境下语音增强系统的设计与实现[D];电子科技大学;2014年

6 马小惠;阵列语音增强在车载环境中的应用[D];大连理工大学;2015年

7 李达;无线声学传感器网络中分布式语音增强方法研究[D];大连理工大学;2015年

8 高珍珍;基于梅尔频谱域HMM的语音增强方法研究[D];北京工业大学;2015年

9 宋环宇;全数字助听器语音增强算法研究[D];哈尔滨工业大学;2014年

10 王永杰;基于麦克风阵列的语音增强算法研究[D];西安电子科技大学;2014年


  本文关键词:基于深度神经网络的语音增强算法研究,由笔耕文化传播整理发布。



本文编号:323210

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/323210.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户40fa7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com