基于圆形麦克风阵列的声源定位算法研究
发布时间:2021-07-16 13:10
目前,麦克风阵列技术在声呐探测、音视频会议、人机交互、助听器、监控系统等方面有着广泛的应用。而基于波达方向估计的麦克风阵列声源定位逐渐在许多领域成为了研究的重点,但由于语音信号的非平稳特性以及外界环境的复杂性,目前已知的声源定位算法存在计算量大、估计失准等问题。针对传统高分辨率谱估计法估计远场声源波达方向(direction of arrival,DOA)时计算量大、对相干信号估计失准的问题,本文提出一种改进的基于圆形麦克风阵列和四阶累积量的声源二维DOA估计算法。本文的主要研究内容如下:1)比较分析不同结构的空间阵列模型,并引入四阶累积量,针对三种不同的高分辨率谱估计算法进行理论分析以及仿真验证,仿真结果证明基于四阶累积MUSIC算法兼具运算量低以及精度高的双重优势。2)针对传统高分辨率谱估计法估计远场声源波达方向时计算量大、对相干信号估计失准的问题,提出一种改进的基于圆形麦克风阵列和四阶累积量的声源二维DOA估计算法。该算法结合了圆阵定位无死角的优势和矩阵虚拟扩展获得更多声源定位信息的长处,重点介绍圆形麦克风阵列相干信号估计模型以及圆阵模式空间变换算法,并对比分析传统的圆阵声源估计...
【文章来源】:湖北工业大学湖北省
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
语音信号频域波形
湖北工业大学硕士学位论文7于300-3400Hz。因此,根据这种情况,选取8000Hz的采样率对初始语音信号进行采样,并获得离散的语音信号,同时利用CoolEditPro软件录取一段语音,其波形如下图2-1和图2-2所示。图2-1语音信号频域波形图2-2语音信号频谱特性2.1.3语音信号语谱图下图2-3为图2-1所示的语音信号的语谱图,其中横轴为时间,纵轴为频率,而给定频率所对应的色调的浓度代表该处频率的强弱。语谱图表示对语音信号时域和频域的联合分析,同时它也直观地显示了语音信号的频率随时间变化的关系。
湖北工业大学硕士学位论文8图2-3语音信号语谱图如上图所示,语音信号的频率介于100-2000Hz之间,因此,语音信号为多频宽带信号,其频谱随着时间而变化,表示其为非平稳的信号,但同时可以看到,在很短时间内(13-36ms)其频谱几乎不随时间而变化,这也表示其具有短时平稳性的特征[29].2.2语音信号处理分析实际中麦克风收到的信号大多来源于室内环境,其接收的信号不仅包含有效的声源信号,还包含着周围的环境噪声。为此,在实现声源定位操作之前,需要进行预处理过程,通常情况下声音信号的预处理可划分为四步:预滤波、加窗分症分频处理和端点检测,图2-4给出了预处理的流程图。预滤波加窗分帧麦克风阵列接收的语音信号去除部分环境噪声分频处理信号帧语音输出端点检测有效信号帧图2-4语音信号预处理过程语音信号经过预滤波能剔除其中的外界噪声,加上语音信号的非平稳特性以及其只有在短时间内维持稳定的限制,因此需要通过加窗分帧操作实现语音信号的短时平稳化。同时,将分帧后的信号进行分频处理以获得离散的语音频谱,为语音信号的平稳化和窄带化处理打下基矗最后,因为语音信号不是持续性信号,因此需要对信号进行端点检测以获取有用信号来进行声源定位。
【参考文献】:
期刊论文
[1]基于Group Lasso的多重信号分类声源定位优化算法[J]. 吴江涛,胡定玉,方宇,朱文发. 应用声学. 2019(02)
[2]基于四阶矩的单矢量水听器多声源定位算法[J]. 郭业才,韩金金,王超. 四川大学学报(自然科学版). 2018(04)
[3]利用空间平滑的协方差秩最小化DOA估计方法[J]. 王洪雁,房云飞,裴炳南. 西安电子科技大学学报. 2018(05)
[4]基于辅助阵元法的非圆信号实值MUSIC算法[J]. 郑春红,贾洁民,邓欢欢,杨刚. 系统工程与电子技术. 2016(11)
[5]远近场混合循环平稳信源定位方法[J]. 燕学智,陈磊,刘国红,刘妍妍. 吉林大学学报(工学版). 2014(05)
[6]复杂环境下基于时延估计的声源定位技术研究[J]. 张大威,鲍长春,夏丙寅. 通信学报. 2014(01)
[7]麦克风阵列拓扑结构对语音增强系统性能影响的理论分析[J]. 王冬霞,赵光,郑家超. 辽宁工业大学学报(自然科学版). 2010(01)
[8]基于四阶累积量的时延估计新方法[J]. 张端金,张中华,郭建军,张德静. 郑州大学学报(工学版). 2010(01)
[9]基于T型麦克风阵列的近场三维声源定位[J]. 胡郢,刁帅. 武汉船舶职业技术学院学报. 2009(06)
[10]语音短时幅度和短时过零率分析与应用[J]. 吴艳花. 电脑知识与技术. 2009(33)
硕士论文
[1]基于麦克风阵列的近场和远场混合声源定位[D]. 姜锦云.西南交通大学 2013
本文编号:3287075
【文章来源】:湖北工业大学湖北省
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
语音信号频域波形
湖北工业大学硕士学位论文7于300-3400Hz。因此,根据这种情况,选取8000Hz的采样率对初始语音信号进行采样,并获得离散的语音信号,同时利用CoolEditPro软件录取一段语音,其波形如下图2-1和图2-2所示。图2-1语音信号频域波形图2-2语音信号频谱特性2.1.3语音信号语谱图下图2-3为图2-1所示的语音信号的语谱图,其中横轴为时间,纵轴为频率,而给定频率所对应的色调的浓度代表该处频率的强弱。语谱图表示对语音信号时域和频域的联合分析,同时它也直观地显示了语音信号的频率随时间变化的关系。
湖北工业大学硕士学位论文8图2-3语音信号语谱图如上图所示,语音信号的频率介于100-2000Hz之间,因此,语音信号为多频宽带信号,其频谱随着时间而变化,表示其为非平稳的信号,但同时可以看到,在很短时间内(13-36ms)其频谱几乎不随时间而变化,这也表示其具有短时平稳性的特征[29].2.2语音信号处理分析实际中麦克风收到的信号大多来源于室内环境,其接收的信号不仅包含有效的声源信号,还包含着周围的环境噪声。为此,在实现声源定位操作之前,需要进行预处理过程,通常情况下声音信号的预处理可划分为四步:预滤波、加窗分症分频处理和端点检测,图2-4给出了预处理的流程图。预滤波加窗分帧麦克风阵列接收的语音信号去除部分环境噪声分频处理信号帧语音输出端点检测有效信号帧图2-4语音信号预处理过程语音信号经过预滤波能剔除其中的外界噪声,加上语音信号的非平稳特性以及其只有在短时间内维持稳定的限制,因此需要通过加窗分帧操作实现语音信号的短时平稳化。同时,将分帧后的信号进行分频处理以获得离散的语音频谱,为语音信号的平稳化和窄带化处理打下基矗最后,因为语音信号不是持续性信号,因此需要对信号进行端点检测以获取有用信号来进行声源定位。
【参考文献】:
期刊论文
[1]基于Group Lasso的多重信号分类声源定位优化算法[J]. 吴江涛,胡定玉,方宇,朱文发. 应用声学. 2019(02)
[2]基于四阶矩的单矢量水听器多声源定位算法[J]. 郭业才,韩金金,王超. 四川大学学报(自然科学版). 2018(04)
[3]利用空间平滑的协方差秩最小化DOA估计方法[J]. 王洪雁,房云飞,裴炳南. 西安电子科技大学学报. 2018(05)
[4]基于辅助阵元法的非圆信号实值MUSIC算法[J]. 郑春红,贾洁民,邓欢欢,杨刚. 系统工程与电子技术. 2016(11)
[5]远近场混合循环平稳信源定位方法[J]. 燕学智,陈磊,刘国红,刘妍妍. 吉林大学学报(工学版). 2014(05)
[6]复杂环境下基于时延估计的声源定位技术研究[J]. 张大威,鲍长春,夏丙寅. 通信学报. 2014(01)
[7]麦克风阵列拓扑结构对语音增强系统性能影响的理论分析[J]. 王冬霞,赵光,郑家超. 辽宁工业大学学报(自然科学版). 2010(01)
[8]基于四阶累积量的时延估计新方法[J]. 张端金,张中华,郭建军,张德静. 郑州大学学报(工学版). 2010(01)
[9]基于T型麦克风阵列的近场三维声源定位[J]. 胡郢,刁帅. 武汉船舶职业技术学院学报. 2009(06)
[10]语音短时幅度和短时过零率分析与应用[J]. 吴艳花. 电脑知识与技术. 2009(33)
硕士论文
[1]基于麦克风阵列的近场和远场混合声源定位[D]. 姜锦云.西南交通大学 2013
本文编号:3287075
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3287075.html