当前位置:主页 > 科技论文 > 网络通信论文 >

基于计算听觉场景分析和麦克风阵列的语音分离的研究

发布时间:2017-05-04 04:11

  本文关键词:基于计算听觉场景分析和麦克风阵列的语音分离的研究,由笔耕文化传播整理发布。


【摘要】:基于计算听觉场景分析的语音分离技术在人工智能、机器感知和自动语音分离等领域有着非常广泛的应用。目前国内外学者致力于噪声环境中语音分离的相关研究,其中语音和噪声自动分离的研究最为困难。多说话人的混合声音分离系统难以取得令人满意的效果,主要是因为在分离的过程中不能综合考虑清音和浊音的情况。本文就是在此研究基础上采取耳间时间差和耳间强度差作为声音的分离线索,其中就如何根据掩蔽阈值获取掩蔽矩阵方面做了重点研究和探讨。首先,详细介绍了计算听觉场景分析的相关理论,并对已有的依据耳间时间差和耳间强度差的语音分离算法进行仿真分析,发现该算法中存在不能任意选取目标语音的缺陷。其次,在已有理论的基础上针对其不足之处,提出了一种缩小筛选范围的改进方案。通过仿真实验表明,优化后的算法可以任意分离两路来自不同方位的语音信号,不但改善了系统的分离效果,而且消除了原始算法中存在的只能分离相对时延较小的声源的局限性。再次,将分离得到的有效时频段信息合成可供我们试听的声音信号,并从时域失真度、分段信噪比、信号波形图和主观听觉四个方面进行考量,从而验证本文提出的改进方法的有效性。最后,在根据掩蔽阈值筛选有效时频段的过程中,引入三个控制范围参数优化系统的分离性能。然后从三个参数入手,逐个研究它们在系统中的重要性,通过改变它们的数值,对系统进行大量的实验仿真,衡量它们对整个系统分离效果的影响,继而确定每个参数的最佳取值。
【关键词】:语音分离 计算听觉场景分析 听觉掩蔽效应 麦克风阵列 耳间时间差 耳间强度差 语音合成
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第1章 绪论10-16
  • 1.1 课题研究的目的及意义10-11
  • 1.2 国内外研究现状11-14
  • 1.2.1 盲信号分离11-13
  • 1.2.2 计算听觉场景分析13-14
  • 1.3 本文主要研究内容14
  • 1.4 论文结构安排14-16
  • 第2章 计算听觉场景分析模型16-24
  • 2.1 听觉生理结构16-18
  • 2.1.1 外耳16-17
  • 2.1.2 中耳17
  • 2.1.3 内耳17-18
  • 2.2 听觉场景分析18-20
  • 2.2.1 同时组合18-19
  • 2.2.2 序列组合19-20
  • 2.2.3 听觉场景分析的准则20
  • 2.3 计算听觉场景的分类20-22
  • 2.3.1 数据驱动型CASA20-21
  • 2.3.2 图式驱动型CASA21-22
  • 2.4 声音分离线索22-23
  • 2.5 本章小结23-24
  • 第3章 基于CASA和麦克风阵列的语音分离24-46
  • 3.1 听觉外围24-30
  • 3.1.1 模拟人耳滤波器组24-27
  • 3.1.2 内耳毛细胞的发放特性和Meddis模型27-30
  • 3.2 特征提取30-35
  • 3.2.1 耳间时间差ITD30-34
  • 3.2.2 耳间强度差IID34-35
  • 3.3 听觉组织35-39
  • 3.3.1 听觉掩蔽效应35-36
  • 3.3.2 确定声音分离线索36-37
  • 3.3.3 利用ITD确定有效时频段37-38
  • 3.3.4 利用IID确定有效时频段38-39
  • 3.4 波形合成39-40
  • 3.5 声音分离的衡量标准40-41
  • 3.6 改进前后的效果对比41-45
  • 3.7 本章小结45-46
  • 第4章 语音分离系统的优化46-58
  • 4.1 系统流程46-48
  • 4.2 参数的优化48-56
  • 4.2.1 ITD对应参数μ的优化48-51
  • 4.2.2 IID对应参数β的优化51-53
  • 4.2.3 IID对应参数η的优化53-55
  • 4.2.4 理想参数的选择55-56
  • 4.3 误差分析56-57
  • 4.4 本章小结57-58
  • 结论58-60
  • 参考文献60-63
  • 攻读硕士学位期间承担的科研任务与主要成果63-64
  • 致谢64-65
  • 作者简介65

【参考文献】

中国期刊全文数据库 前3条

1 王忠文;谢莉萍;梁杰豪;;基于计算听觉场景分析的混叠语音分离算法[J];电声技术;2008年10期

2 李白燕;郭水旺;李应生;;基于两步法稀疏分量分析的欠定盲源分离[J];电声技术;2010年09期

3 王想实;;听觉场景分析简析[J];技术与市场;2011年06期


  本文关键词:基于计算听觉场景分析和麦克风阵列的语音分离的研究,由笔耕文化传播整理发布。



本文编号:344366

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/344366.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2c7fc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com