当前位置:主页 > 科技论文 > 信息工程论文 >

骨导和气导结合的语音增强系统搭建

发布时间:2017-09-04 03:16

  本文关键词:骨导和气导结合的语音增强系统搭建


  更多相关文章: 语音增强 六通道 骨导语音 深度神经网络


【摘要】:气导语音在通讯过程中非常容易遭受各种噪声的干扰。所以,以空气为媒介传播的信号自然而然的遭受到多种多样噪声的干扰,例如信道以及别的发言者的滋扰。本文引入的骨导语音信号,对音源的采集不是来自声音传感器,而是通过高灵敏的振动传感器采集颅骨的振动,然后再转换为音频信号。其优点是从声源处屏蔽了背景噪声,但是通过人体采集到的语音信号,高频衰减十分严重,在信噪比较高的环境下使用反而不如传统的气导设备。为了发挥骨导和气导各自信息特征的优势,本文重点研究基于骨导和气导融合的语音增强系统搭建。主要包括以下内容:首先,基于LabVIEW和NI的八通道数据采集卡完成鼻梁、额头、耳骨、喉咙、嘴唇上面颊和气导语音共六通路的同步语音采集和保存,为了防止采集大批数据所用时间长缓冲区溢出和丢数据的问题,本文所编的采集和保存程序采取了生产者消费者模式,边采集边保存。其次,研究多种用于气导语音增强的技术,为后续六通道数据融合做准备,本文不但用了较经典的谱减法、wiener法、MMSE以及每一个经典增强算法的改进算法,还用了较为新颖的小波变换法和子空间法,每一种方法都进行了仿真实验,每个方法都各有优缺点,经典的方法所能去除的噪声类型存在差异,需要选用不一样的语音增强算法来去噪和增加清晰度,具有一定的局限性。相对而言,小波变换法处理语音失真度更小,去噪效果更好,类似的还有子空间。但是,上述方法常用的信噪比范围为0dB~15dB,在信噪比低到-5dB时,上述方法都已不适用。完成骨导语音的频谱扩展,先提取六路语音的特征参数,以气导语音的特征参数为目标输出,分别以五路骨导语音的特征参数为源输入,进行深度神经网络训练,建立骨导语音到气导语音的模型转换,用气导语音弥补骨导语音高频,提到骨导语音的清晰度。本文重在完成气导语音和五路频谱扩展后的骨导语音进行自适应融合,估计背景噪声的强弱,实现在高信噪比的情况下,自适应增大气导语音的权值,削弱各路骨导语音的权值,低信噪比时则反之。基于此方法的实用性更强,增强语音的效果更好。
【关键词】:语音增强 六通道 骨导语音 深度神经网络
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.35
【目录】:
  • 摘要4-5
  • ABSTRACT5-10
  • 第1章 绪论10-19
  • 1.1 课题研究背景及意义10-11
  • 1.2 语音增强技术国内外研究现状11-17
  • 1.2.1 基于气导的语音增强研究11-14
  • 1.2.2 基于骨导的语音增强研究14-16
  • 1.2.3 基于骨导和气导融合的语音增强研究16-17
  • 1.3 语音增强系统的主要组成17
  • 1.4 课题研究的目的17-18
  • 1.5 课题研究的主要内容18-19
  • 第2章 语音增强的理论基础19-26
  • 2.1 引言19
  • 2.2 语音增强理论依据19-21
  • 2.2.1 纯净语音特性19-20
  • 2.2.2 噪声语音特性20-21
  • 2.3 语音分析与合成21-22
  • 2.3.1 说话人相关特征21-22
  • 2.3.2 骨导和气导语音的相关性22
  • 2.4 语音增强效果的评价标准22-25
  • 2.4.1 主观评价23-24
  • 2.4.2 客观评价24-25
  • 2.5 本章小节25-26
  • 第3章 基于气导的语音增强技术26-48
  • 3.1 引言26
  • 3.2 基于谱减法的语音增强26-29
  • 3.2.1 基本谱减法26-27
  • 3.2.2 多窗谱估计谱减法27-29
  • 3.3 基于维纳滤波法的语音增强29-31
  • 3.3.1 基本维纳滤波法29-30
  • 3.3.2 基于先验信噪比的维纳滤波法30-31
  • 3.4 基于最小均方误差算法的语音增强31-35
  • 3.4.1 基本最小均方误差法31-33
  • 3.4.2 对数谱最小均方误差法33-35
  • 3.5 基于小波阈值的语音增强35-38
  • 3.5.1 小波变换基本理论35-37
  • 3.5.2 小波阈值去噪37-38
  • 3.6 基于子空间的语音增强38-39
  • 3.6.1 子空间去噪基本理论38
  • 3.6.2 子空间算法38-39
  • 3.7 实验仿真及结果分析39-47
  • 3.8 本章小结47-48
  • 第4章 基于骨导和气导的频谱扩展技术48-66
  • 4.1 引言48
  • 4.2 语音特征提取48-49
  • 4.3 频谱扩展关键技术49-54
  • 4.3.1 线性预测分析技术49-51
  • 4.3.2 频谱扩展技术51-54
  • 4.4 基于改进神经网络的频谱扩展54-64
  • 4.4.1 DNN基础理论55-57
  • 4.4.2 骨导语音的频谱扩展57-58
  • 4.4.3 实验仿真58-64
  • 4.5 本章小结64-66
  • 第5章 基于骨导和气导融合的语音增强技术66-78
  • 5.1 引言66-67
  • 5.2 语音采集和保存67-70
  • 5.2.1 硬件设备67
  • 5.2.2 采集和保存软件设计67-69
  • 5.2.3 采集保存的语音69-70
  • 5.3 骨导和气导融合的语音增强70-72
  • 5.3.1 基于自适应抵消的AC和BC的融合70-71
  • 5.3.2 基于FLANN的多通道数据融合71-72
  • 5.4 实验仿真及结果分析72-77
  • 5.5 本章小结77-78
  • 结论78-80
  • 参考文献80-87
  • 致谢87


本文编号:789023

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/789023.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户024c0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com