基于神经网络的鲁棒双耳声源定位研究
发布时间:2021-01-15 07:10
声源定位技术作为语音信号处理系统的重要前端,在视频会议、助听器、机器人听觉等方面有广泛的应用。声源定位算法包括基于麦克风阵列的定位算法和基于双耳的定位算法。基于双耳的声源定位模拟人耳听觉感知的特性,从而实现定位,但以往的双耳声源定位算法在混响与噪声中定位性能显著下降。本文结合近年来兴起的神经网络,以双耳空间信息为基础,研究鲁棒的双耳声源定位算法。本文主要分析和实现了两种基于神经网络的双耳声源定位算法:基于子带深度神经网络的双耳声源定位算法和基于长短期记忆网络的双耳声源定位算法。(1)基于子带深度神经网络的双耳声源定位算法。基于子带深度神经网络DNN(Deep Neural Networks)的双耳声源定位算法是对原有基于DNN定位算法的改进。原有算法是基于全频带的,而子带定位算法模拟人耳的时频分析特性,将双耳声信号划分为多个子带,利用子带的双耳空间定位特征参数互相关函数CCF(Cross Correlation Function)和耳间强度差IID(Interaural Intensity Difference),建立子带DNN。在子带内,将声源定位看做多分类问题,同时根据乘积规则和求...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
人耳的生理结构
如图2-2 所示。由坐标(r, θ,φ)来表示声源的位置信息。其中,r 表示声源到原点的距离,取值范围为 0≤ r <+∞;θ 表示方向矢量在水平面的投影与中垂面的夹角,θ=0°表示正前方,θ=90°、180°和-90°分别表示头部的正右方、正后方和正左方,-180°≤θ≤180°;仰角φ表示仰角,即方向矢量与水平面的夹角,范围为-90°≤φ≤90°,在垂直方向,φ=-90°、0°和+90°分别表?
ITD原理示意图
【参考文献】:
期刊论文
[1]基于子带信噪比估计和软判决的鲁棒双耳声源定位算法[J]. 周琳,赵小燕,程旭,李拟珺,吴镇扬. 东南大学学报(自然科学版). 2015(04)
硕士论文
[1]鲁棒的双耳语音分离算法的研究[D]. 徐耀.东南大学 2017
[2]基于双耳声源定位的鲁棒语音分离研究[D]. 束佳明.东南大学 2016
[3]基于双耳空间信息的语音分离研究[D]. 李枭雄.东南大学 2015
本文编号:2978477
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
人耳的生理结构
如图2-2 所示。由坐标(r, θ,φ)来表示声源的位置信息。其中,r 表示声源到原点的距离,取值范围为 0≤ r <+∞;θ 表示方向矢量在水平面的投影与中垂面的夹角,θ=0°表示正前方,θ=90°、180°和-90°分别表示头部的正右方、正后方和正左方,-180°≤θ≤180°;仰角φ表示仰角,即方向矢量与水平面的夹角,范围为-90°≤φ≤90°,在垂直方向,φ=-90°、0°和+90°分别表?
ITD原理示意图
【参考文献】:
期刊论文
[1]基于子带信噪比估计和软判决的鲁棒双耳声源定位算法[J]. 周琳,赵小燕,程旭,李拟珺,吴镇扬. 东南大学学报(自然科学版). 2015(04)
硕士论文
[1]鲁棒的双耳语音分离算法的研究[D]. 徐耀.东南大学 2017
[2]基于双耳声源定位的鲁棒语音分离研究[D]. 束佳明.东南大学 2016
[3]基于双耳空间信息的语音分离研究[D]. 李枭雄.东南大学 2015
本文编号:2978477
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2978477.html