当前位置:主页 > 科技论文 > 信息工程论文 >

基于计算听觉场景分析的语音增强

发布时间:2017-08-27 08:02

  本文关键词:基于计算听觉场景分析的语音增强


  更多相关文章: 语音增强 计算听觉场景分析 维纳滤波器 听觉掩蔽矩阵 噪声谱估计


【摘要】:语音增强算法可以对噪声进行削弱处理,增加混合声音中目标声音的清晰度,因此语音增强受到学者们的重视。目前可以用很多方法进行语音增强,例如谱减法、子空间算法以及统计模型等方法,而基于听觉场景分析的语音增强算法相较于以往的其他算法,有着重要意义:它不需要考虑清音和浊音的情况,无论对什么样的噪声都可以滤除。本文在原始的基于计算听觉场景分析(Calculation Auditory Scene Analysis,简称CASA)的语音增强算法基础上进行优化,引入wiener滤波器,并且对语音增强质量进行了分析。首先,对以往的基于计算听觉场景分析的语音增强算法进行研究,并对语音增强效果进行了分析,使用原始算法增强的语音尽管从主观听觉上可以听到噪声有一定的减弱,但仍然很刺耳,而且输出信噪比不是很高。其次,为了提高增强后语音的信噪比以及使听到的声音更让人接受,引入了改进的维纳滤波器,通过听觉外围模型与wiener滤波器的相互结合,发现使用该改进算法的确可以提高增强后的语音质量。由于听觉外围模型与维纳滤波器相结合的方法具有一定的局限性,需要已知噪声的频谱,因此又引入了一种通过对噪声谱估计求取wiener滤波器系统函数的算法,该算法用在前述的基于计算听觉场景分析改进算法的末端,对于不同类型的噪声,都能进行一定的滤除。该算法更加简洁,并且具有一定的实用性。最后,将基于CASA的语音增强原始算法、听觉外围模型与wiener滤波器相结合的改进算法以及基于噪声谱估计的CASA语音增强最终改进算法,分别从主观听觉、信噪比、对数谱失真测度以及波形图四个方面进行对比,都表现出改进算法要优于原始方法,从而得出本文改进方法能够更有效的滤除噪声。
【关键词】:语音增强 计算听觉场景分析 维纳滤波器 听觉掩蔽矩阵 噪声谱估计
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.35
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第1章 绪论10-16
  • 1.1 课题的研究目的及意义10-11
  • 1.2 研究现状和存在的问题11-14
  • 1.2.1 语音增强11-13
  • 1.2.2 计算听觉场景分析13-14
  • 1.3 本文主要研究内容14
  • 1.4 论文结构安排14-16
  • 第2章 基于CASA语音增强理论依据16-28
  • 2.1 计算声场景分析的基本结构16-19
  • 2.1.1 计算听觉场景分析的基本流程16-17
  • 2.1.2 同时组合17-19
  • 2.1.3 序列组合19
  • 2.2 计算听觉场景的分类19-21
  • 2.2.1 数据驱动型(信息单向流动)CASA20
  • 2.2.2 图式驱动型(信息双向流动)CASA20-21
  • 2.3 计算听觉场景分析的应用范围21-22
  • 2.4 语音增强的基本理论22-25
  • 2.4.1 语音信号产生的数字模型22-24
  • 2.4.2 语音的特性24
  • 2.4.3 噪声特性24-25
  • 2.5 听觉外围系统25-26
  • 2.5.1 人耳听觉系统组成25-26
  • 2.5.2 听觉系统工作原理26
  • 2.6 语音增强质量评估26-27
  • 2.7 本章小结27-28
  • 第3章 基于CASA的语音增强算法具体实现28-42
  • 3.1 听觉外围系统的模拟28-32
  • 3.1.1 基于Gammatone滤波器的听觉模型28-30
  • 3.1.2 Meddis模型与内耳毛细胞听觉发放率30-32
  • 3.2 特征提取32-35
  • 3.2.1 双耳时间差(ITD)32-35
  • 3.2.2 双耳强度差(IID)35
  • 3.3 听觉组织35-38
  • 3.3.1 听觉掩蔽效应35-36
  • 3.3.2 确定语音增强线索36-37
  • 3.3.3 利用时间差强度差求掩蔽矩阵37-38
  • 3.4 语音信号的合成算法38-40
  • 3.5 中值平滑处理40
  • 3.6 实验仿真40-41
  • 3.7 本章小结41-42
  • 第4章 听觉外围与维纳滤波器相互结合的算法42-48
  • 4.1 维纳滤波器的介绍42-43
  • 4.2 维纳滤波器系统函数的求取43-45
  • 4.3 实验仿真以及与原始方法的增强结果进行对比45-47
  • 4.4 本章小结47-48
  • 第5章 基于噪声谱估计的听觉场景分析增强算法48-68
  • 5.1 基于噪声谱估计的CASA语音增强算法48-54
  • 5.1.1 理论依据48-50
  • 5.1.2 具体实现步骤50-51
  • 5.1.3 前导无声段初始化时间IS的选取51-54
  • 5.2 实验仿真以及将三种方法的增强结果进行对比54-66
  • 5.2.1 输入信噪比为 5db时增强结果对比54-56
  • 5.2.2 输入信噪比为 0db时增强结果对比56-57
  • 5.2.3 输入信噪比为-5db时增强结果对比57-66
  • 5.3 本章小结66-68
  • 结论68-70
  • 参考文献70-74
  • 致谢74

【相似文献】

中国期刊全文数据库 前10条

1 胡光锐,虞晓;基于二阶前向结构和信息最大理论的语音增强算法[J];上海交通大学学报;2000年07期

2 姚峰英,张敏;用于语音增强的高频信噪比度量[J];声学学报;2002年05期

3 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期

4 王金明,张雄伟;一种基于自适应模糊滤波的语音增强方法[J];解放军理工大学学报(自然科学版);2003年01期

5 杨汇军,郑海英,王立红;语音增强方法的研究[J];辽宁工学院学报;2003年05期

6 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期

7 孙新德;一种改进的语音增强方法及实现[J];郑州航空工业管理学院学报(社会科学版);2005年04期

8 钱国青;赵鹤鸣;;基于改进谱减算法的语音增强新方法[J];计算机工程与应用;2005年35期

9 王晶,傅丰林,张运伟;语音增强算法综述[J];声学与电子工程;2005年01期

10 杨毅;杨宇;余达太;;语音增强及其消噪能力研究[J];微电子学与计算机;2006年07期

中国重要会议论文全文数据库 前10条

1 陈凯;俞蒙槐;胡上序;付强;;语音增强系统性能评测方法综述[A];第四届全国人机语音通讯学术会议论文集[C];1996年

2 王建波;林本浩;田春明;刘睿;;语音增强及其相关技术研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年

3 徐舒;孙洪;;基于融合迭代的语音增强方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

4 牛刚;任新智;吴国庆;;谐波能量汇集度在语音增强中的应用[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

5 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

6 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

7 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

8 刘淑华;胡强;覃团发;万海斌;;语音增强算法的研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年

9 魏臻;张景达;陆阳;;嵌入式系统中语音增强改进算法的研究[A];2007'中国仪器仪表与测控技术交流大会论文集(一)[C];2007年

10 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

中国博士学位论文全文数据库 前10条

1 欧世峰;变换域语音增强算法的研究[D];吉林大学;2008年

2 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年

3 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年

4 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年

5 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

6 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年

7 徐勇;基于深层神经网络的语音增强方法研究[D];中国科学技术大学;2015年

8 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年

9 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年

10 赵彦平;基于稀疏表示的语音增强方法研究[D];吉林大学;2014年

中国硕士学位论文全文数据库 前10条

1 肖佩霖;双通道语音增强系统设计与实现[D];哈尔滨工业大学;2011年

2 魏有权;基于噪声估计的语音增强算法研究[D];昆明理工大学;2015年

3 郭栗;特定人语音增强算法的研究[D];上海交通大学;2015年

4 纪志春;基于字典学习的语音增强算法研究[D];大连海事大学;2016年

5 尹波;基于麦克风小阵列的语音增强算法的研究[D];湖北工业大学;2016年

6 张建伟;基于噪声谱估计和信噪比约束的语音增强研究[D];安徽大学;2016年

7 魏泉水;基于深度神经网络的语音增强算法研究[D];南京大学;2016年

8 王鹏宇;压缩感知技术在语音增强和EEG信号中的应用研究[D];福州大学;2014年

9 魏清泉;有色噪声下语音增强算法及应用研究[D];福州大学;2014年

10 黄剑文;多通道语音增强算法及应用研究[D];福州大学;2014年



本文编号:745017

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/745017.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户00e7d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com