复杂背景下的声源定位和识别
发布时间:2022-07-27 14:14
随着智能音箱,语音助手,智能办公,机器人等新技术的发展。智能化信号处理,特别是声音信号处理的需求越来越大。人工智能在信号处理领域的应用也越来越广泛。机器听觉和机器视觉一样,在未来将成为智能感知领域的重要应用。因此,在复杂环境,特别是存在环境噪音和室内混响的声学环境下,声源的定位和识别对于智能语音处理来说有重要的意义。麦克风阵列通过多个方向的接收声音信号,对于声源的到达方向(DOA)估计以及重叠声音的识别和分类起到了关键作用。利用麦克风阵列,本文对复杂声学环境下多个声源的定位和识别进行了研究和探索,主要的工作和创新如下:第一,构建了麦克风阵列的传播和接收信号数学模型,分析了基于到达时间差的GCC-PHAT和SRP-PHAT算法,基于谱估计的MUSIC算法和ISSM算法。以及LCMV自适应波束形成算法,并仿真验证了各类算法的性能。第二,进行了真实室内环境中窄带和宽带信号麦克风阵列定位实验,使用MUSIC算法和ISSM算法实现了实验数据的DOA估计,使用LCMV波束形成实现了实验信号的空域滤波。有效过滤干扰信号,保留需要的方向信号。对得到的信号进行降噪和增强处理,可以实现原始信号的恢复。第三...
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究历史与现状
1.2.1 声源定位
1.2.2 声音事件识别
1.3 本文的主要贡献与创新
1.4 本论文的结构安排
第二章 麦克风阵列声源定位与波束形成
2.1 麦克风阵列模型
2.2 麦克风阵列DOA算法和仿真
2.2.1 基于时延的估计算法
2.2.2 多重信号分类算法
2.2.3 非相干信号子空间算法
2.3 自适应波束形成
2.3.1 固定波束形成器
2.3.2 最小方差波束形成器
2.3.3 LCMV波束成形仿真
2.4 本章小结
第三章 基于线性阵列的声源定位和分离实验
3.1 窄带信号DOA估计
3.2 宽带信号DOA估计
3.3 信号空域滤波
3.3.1 窄带信号空域滤波
3.3.2 宽带信号空域滤波
3.4 本章小结
第四章 基于卷积循环神经网络的空间固定声源识别定位
4.1 声音事件检测定位概述
4.2 基于卷积循环网络的声源定位识别系统
4.2.1 系统整体架构
4.2.2 网络结构
4.2.3 数据集
4.2.4 特征提取
4.2.5 评估指标
4.3 网络训练和结果分析
4.3.1 网络训练过程
4.3.2 结果分析
4.4 固定声源的空间波束形成
4.5 本章小结
第五章 基于卷积循环神经网络的空间运动声源识别定位
5.1 运动声源检测定位概述
5.2 数据集和特征提取
5.2.1 空间麦克风阵列格式
5.2.2 数据集
5.2.3 特征提取
5.3 运动声源检测定位任务网络结构
5.4 结果分析
5.4.1 DCASE数据测试结果
5.4.2 urbansound8k数据测试结果
5.5 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的成果
本文编号:3665602
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究历史与现状
1.2.1 声源定位
1.2.2 声音事件识别
1.3 本文的主要贡献与创新
1.4 本论文的结构安排
第二章 麦克风阵列声源定位与波束形成
2.1 麦克风阵列模型
2.2 麦克风阵列DOA算法和仿真
2.2.1 基于时延的估计算法
2.2.2 多重信号分类算法
2.2.3 非相干信号子空间算法
2.3 自适应波束形成
2.3.1 固定波束形成器
2.3.2 最小方差波束形成器
2.3.3 LCMV波束成形仿真
2.4 本章小结
第三章 基于线性阵列的声源定位和分离实验
3.1 窄带信号DOA估计
3.2 宽带信号DOA估计
3.3 信号空域滤波
3.3.1 窄带信号空域滤波
3.3.2 宽带信号空域滤波
3.4 本章小结
第四章 基于卷积循环神经网络的空间固定声源识别定位
4.1 声音事件检测定位概述
4.2 基于卷积循环网络的声源定位识别系统
4.2.1 系统整体架构
4.2.2 网络结构
4.2.3 数据集
4.2.4 特征提取
4.2.5 评估指标
4.3 网络训练和结果分析
4.3.1 网络训练过程
4.3.2 结果分析
4.4 固定声源的空间波束形成
4.5 本章小结
第五章 基于卷积循环神经网络的空间运动声源识别定位
5.1 运动声源检测定位概述
5.2 数据集和特征提取
5.2.1 空间麦克风阵列格式
5.2.2 数据集
5.2.3 特征提取
5.3 运动声源检测定位任务网络结构
5.4 结果分析
5.4.1 DCASE数据测试结果
5.4.2 urbansound8k数据测试结果
5.5 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的成果
本文编号:3665602
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3665602.html