车载环境下驾驶员语音增强方法研究
本文关键词:车载环境下驾驶员语音增强方法研究
更多相关文章: 车载环境 语音增强 小波变换 盲源分离 声纹识别
【摘要】:车载语音识别系统是出于解放驾驶员双手、提供驾驶乐趣、促进安全出行等目的而诞生的。近年来,伴随着我国汽车使用量的激增,车载语音识别系统也得到了广泛关注,国内外从2000年开始已有相关产品陆续问世。现有的语音识别产品,在安静环境下识别率能达到97%左右,但在车载环境下,却难以达到实用标准。究其原因,主要是车载环境下路况复杂,各种环境噪声影响了识别率,严重时甚至会影响驾驶安全。车载语音识别系统中很重要的一方面是首先要在车载环境中区别出驾驶员的语音,这是后面驾驶员语音识别的关键,因此本文重点研究车载环境下驾驶员语音增强问题。车载环境噪声包含语音噪声和非语音噪声,传统的语音增强方法并不能去除非驾驶员的语音干扰,因此本文从语音分离的角度出发来增强驾驶员语音。本文所做的工作包括如下两个方面:(1)设计了一种基于小波阈值去噪预处理与盲源分离相结合的方法。由于车载环境下驾驶员语音分离问题属于欠定盲源分离,不易于实现,而且盲源分离算法不能高效提高信噪比,因此引入小波阈值去噪算法作为预处理。该方法首先对带噪语音进行小波阈值去噪,过滤掉非语音噪声,得到包含驾驶员语音的多人混合语音。从而将欠定盲源分离问题转化为非欠定盲源分离问题,并且大大提高了信噪比。然后采用快速独立分量分析法对多人混合语音进行分离,得到各个说话人的独立语音分量。(2)利用声纹特征从多人语音中选择出驾驶员语音分量。该方法选择梅尔倒谱系数(MFCC)作为声纹特征参数,并用矢量量化(VQ)作为模式匹配方法。在训练阶段,训练驾驶员的MFCC参数模板;在测试阶段,对盲源分离得到的各个说话人信号提取MFCC参数,计算其与模板的距离,将距离最小的语音分量判断为驾驶员语音。对上述方法的仿真结果表明,本文所提出的驾驶员语音增强方法对复杂路况的非语音噪声具有一定的去噪效果,并能提高信噪比;去除了非语音噪声能够将复杂的欠定盲源分离问题转化为简单的非欠定盲源分离问题,从而清晰地分离出多人混合语音分量;采用声纹匹配的方法,不需要麦克风阵列的支持,就能准确地识别出驾驶员语音分量。该方法较为简单、易于在车载硬件平台上实现。
【关键词】:车载环境 语音增强 小波变换 盲源分离 声纹识别
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.35
【目录】:
- 摘要5-6
- ABSTRACT6-11
- 缩略语对照表11-14
- 第一章 绪论14-18
- 1.1 引言14
- 1.2 研究背景及意义14-15
- 1.3 车载环境下驾驶员语音增强的研究进展15-17
- 1.4 论文主要研究内容和组织结构17-18
- 第二章 车载语音增强18-36
- 2.1 语音信号的特点18-20
- 2.2 车载环境噪声分析20-21
- 2.2.1 噪声20-21
- 2.2.2 车载噪声21
- 2.3 语音增强常用算法21-31
- 2.3.1 谱减法22-24
- 2.3.2 维纳滤波算法24-27
- 2.3.3 子空间语音增强算法27-31
- 2.4 语音增强算法的性能评估31-34
- 2.5 语音信号盲源分离34-35
- 2.6 本章小结35-36
- 第三章 一种基于小波阈值去噪和盲源分离的语音增强算法36-60
- 3.1 小波阈值去噪算法36-42
- 3.1.1 小波变换的定义37-38
- 3.1.2 离散小波变换38
- 3.1.3 常用小波函数38-39
- 3.1.4 小波阈值去噪算法39-42
- 3.2 FastICA盲源分离算法42-44
- 3.2.1 盲源分离数学模型42-43
- 3.2.2 ICA43-44
- 3.2.3 FastICA44
- 3.3 基于小波阈值去噪的盲源分离算法44-47
- 3.4 实验仿真47-57
- 3.5 本章小结57-60
- 第四章 多人语音中的驾驶员语音识别60-72
- 4.1 声纹60-61
- 4.2 声纹识别方法61-67
- 4.2.1 声纹识别61-62
- 4.2.2 常用特征提取62-66
- 4.2.3 模式匹配方法66-67
- 4.3 利用声纹识别驾驶员语音67
- 4.4 实验仿真67-70
- 4.5 本章小结70-72
- 第五章 总结与展望72-74
- 5.1 总结72
- 5.2 展望72-74
- 参考文献74-78
- 致谢78-80
- 作者简介80-81
【参考文献】
中国期刊全文数据库 前10条
1 宋宇宁;郭荣;朱丽军;;基于小波基函数选取与阈值法的语音去噪算法研究[J];科技展望;2014年11期
2 朱淑琴;赵瑛;;DTW语音识别算法研究与分析[J];微计算机信息;2012年05期
3 李文;夏秀渝;何培宇;李源;;基于麦克风阵列的近场声源定位[J];四川大学学报(自然科学版);2008年02期
4 林志斌;徐柏龄;;基于球麦克风阵列的三维空间多声源定位(英文)[J];南京大学学报(自然科学版);2006年04期
5 马义德,袁敏,齐春亮,刘悦,刘映杰;基于PCNN的语谱图特征提取在说话人识别中的应用[J];计算机工程与应用;2005年20期
6 杜先平 ,隋修礼;汽车噪声解析[J];汽车运用;2005年06期
7 张万里,刘桥;Mel频率倒谱系数提取及其在声纹识别中的作用[J];贵州大学学报(自然科学版);2005年02期
8 江太辉;基于VQ的说话人识别算法与实验[J];计算机工程与应用;2004年09期
9 王让定,柴佩琪;语音倒谱特征的研究[J];计算机工程;2003年13期
10 赵力,邹采荣,吴镇扬;HMM在说话人识别中的应用[J];电路与系统学报;2001年03期
中国硕士学位论文全文数据库 前4条
1 徐志夺;基于小波变换的语音增强算法研究[D];哈尔滨工程大学;2013年
2 卢宏;欠定盲信号分离方法研究[D];杭州电子科技大学;2011年
3 邓玉娟;基于小波变换的语音阈值去噪算法研究[D];重庆大学;2009年
4 刘瑾;基于盲源分离的语音增强方法研究[D];大连理工大学;2006年
,本文编号:1069116
本文链接:https://www.wllwen.com/kejilunwen/wltx/1069116.html