基于小型阵列MIC的声源定位系统设计与实现
发布时间:2020-05-01 19:41
【摘要】:近年来,随着人工智能的发展,机器人智能化得到更近一步的推进,服务型机器人越来越多的介入到人们的生活当中。为了让机器人能够更好地应对复杂的工作环境,机器人需要能够实时获取环境中的信息并进行及时处理,其中声音是要获取的关键信息,而对声源进行定位是机器人应对周围环境的一种关键算法。基于实验室现有机器人项目,本文设计一款基于小型麦克风阵列的声源定位系统来解决机器人对声源进行定位的问题。本文通过介绍三种经典的基于麦克风阵列的定位方法,分析其工作原理、适用领域及各自的优缺点,并结合机器人项目的需求,最终选择出可控波束形成技术与相位变换(PHAse Transform,PHAT)加权系数相结合的SRP-PHAT(Steered Response Power with PHAse Transform)声源定位方法作为本论文的参考实现方案。通过实验发现,SRP-PHAT声源定位方法定位时间较长,并不满足机器人平台实时性定位的需要,而问题主要在于SRP-PHAT定位方法中的声源搜索方法性能较低,因此本文采用粒子群算法对传统声源搜索方法进行改进,通过仿真实验对比验证了粒子群算法改进声源搜索方法的有效性。最后设计了麦克风阵列,构建了基于xCore-200平台的基础硬件环境,在此基础上实现了传统搜索方法及粒子群算法改进的搜索方法,并通过实验分析这两种方法在水平二维空间上的方位角精度和距离精度以及定位的实时性。实验结果表明,基于xCore-200所实现的定位系统,方位角估计成功率基本都在90%以上,平均误差可以控制在5°以内;距离估计略差,平均估计成功率约为80%,平均误差约为0.25m;在时间开销方面,平均单次定位时间为525.23ms。相比较传统网格搜索方法,改进后的方法保证了定位系统的精度,并将定位时间缩短了20.48%。
【图文】:
泛的应用场景。图 1-2 与某合作公司共同研发的智能服务机器人原型机此外,本人所在实验室与众多机器人公司合作研发机器人,如图1-2 为与某合作公司共同研发的智能服务机器人原型机,本论文则致力于解决麦克风阵列安装困难和嵌入式低速设备进行实时定位的问题,改善项目当中机器人与人之间的交互体验,故而本论文以少量麦克风构建小型阵列,,并以此为基础设计实现一个适用于机器人平台的声源定位系统。由于机器人平台运算性能较低,而又对定位精度有一定的要求,这就要求所采用的算法在保证定位效果的情况下尽可能的缩短定位时间,同时保证定位的精确性和实时性两方面的性能。研究意义本文针对智能服务型机器人平台,设计并实现了基于小型麦克风阵列的声源定位系统,主要具有以下几点意义:(1) 构建适用于智能服务型机器人平台的小型麦克风阵列,扩大麦克风阵列的应用场景。
a) 某一帧音频信号 图 3-2 音频为了获得较为平稳的音频信号,需要对整体的波形图。分帧通常采用重叠分段的方法,分段是的过渡较为平滑,保持语音信号特征的连续性,设定为 10~40ms,重叠率通常在 50%~100%范围32ms,采样率为 32kHz,因此一个音频帧中具有50%,即帧移为 512 个采样点。最常用的分帧方常将这个过程称为加窗,而滑动窗口函数称为窗汉宁窗、三角窗和布莱克曼窗[13]等,其中矩形窗长度的音频片段即为采用了矩形窗,这种方式的计也采用矩形窗。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3;TP242
本文编号:2646989
【图文】:
泛的应用场景。图 1-2 与某合作公司共同研发的智能服务机器人原型机此外,本人所在实验室与众多机器人公司合作研发机器人,如图1-2 为与某合作公司共同研发的智能服务机器人原型机,本论文则致力于解决麦克风阵列安装困难和嵌入式低速设备进行实时定位的问题,改善项目当中机器人与人之间的交互体验,故而本论文以少量麦克风构建小型阵列,,并以此为基础设计实现一个适用于机器人平台的声源定位系统。由于机器人平台运算性能较低,而又对定位精度有一定的要求,这就要求所采用的算法在保证定位效果的情况下尽可能的缩短定位时间,同时保证定位的精确性和实时性两方面的性能。研究意义本文针对智能服务型机器人平台,设计并实现了基于小型麦克风阵列的声源定位系统,主要具有以下几点意义:(1) 构建适用于智能服务型机器人平台的小型麦克风阵列,扩大麦克风阵列的应用场景。
a) 某一帧音频信号 图 3-2 音频为了获得较为平稳的音频信号,需要对整体的波形图。分帧通常采用重叠分段的方法,分段是的过渡较为平滑,保持语音信号特征的连续性,设定为 10~40ms,重叠率通常在 50%~100%范围32ms,采样率为 32kHz,因此一个音频帧中具有50%,即帧移为 512 个采样点。最常用的分帧方常将这个过程称为加窗,而滑动窗口函数称为窗汉宁窗、三角窗和布莱克曼窗[13]等,其中矩形窗长度的音频片段即为采用了矩形窗,这种方式的计也采用矩形窗。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3;TP242
【参考文献】
相关期刊论文 前4条
1 张婷婷;陈静;;我国老人护理服务机器人的应用探析[J];管理观察;2014年10期
2 徐勤奇;杨鹏;;基于正四面体阵列的声源定位算法及误差分析[J];计算机仿真;2013年07期
3 严素清,黄冰;传声器阵列的声源定位研究[J];电声技术;2004年12期
4 马晓红,陆晓燕,殷福亮;改进的互功率谱相位时延估计方法[J];电子与信息学报;2004年01期
本文编号:2646989
本文链接:https://www.wllwen.com/kejilunwen/wltx/2646989.html