基于Cortex-A8嵌入式系统的声源定位技术研究与实现
本文关键词:基于Cortex-A8嵌入式系统的声源定位技术研究与实现
【摘要】:伴随着多媒体技术的快速发展,语音信号处理技术在接收和处理信息等方面得到了越来越广泛的关注,语音识别、语音增强、声源定位等应用方兴未艾。而声源的定位技术是语音增强、语音识别技术的前提和基础。基于麦克风阵列的声源定位技术已经成为一大研究热点,其广阔的应用前景得到了广泛的关注。当前基于麦克风阵列的声源定位技术主要分为:基于高分辨率谱估计的声源定位、基于可控波束形成的声源定位、基于时延估计的声源定位。而在这三种算法中,基于时延估计的声源定位算法计算复杂度低,实用性较强,是实时声源定位应用的首选。基于此,本文开展了基于时延估计的实时声源定位算法研究。本文主要从理论研究、软硬件平台搭建、实际场景验证三个方面进行研究。(1)本文第二章开展了针对时延估计算法的研究。在分析对比各种麦克风阵型的基础上,选取四元十字阵作为麦克风阵列的阵型,并推导了基于四元十字阵的声源定位算法的公式。在此基础上,研究了几种基于时延估计的声源定位算法,针对广义互相关算法在低信噪比、混响大的环境下鲁棒性较差的问题,提出了一种多通道加权联合算法。该算法先把信号进行多通道滤波分解,再分别计算各通道的互相关值,最后对各通道进行加权联合计算出时延。仿真实验表明,多通道加权联合算法的鲁棒性比广义互相关中的PHAT和SCOT加权算法强。(2)基于理论研究基础,设计了基于Cortex-A8嵌入式平台的声源定位系统,并进行了相应的硬件选型与调试及算法移植工作。首先,在硬件设计方面,选用S5PV210作为核心处理器、WM8960作为音频编解码芯片,并搭建了外围电路;其次,在软件开发方面,分别进行了系统搭建,WM8960音频驱动程序移植,定位算法编写、测试、及移植;最终完成了基于Cortex-A8嵌入式平台的声源定位系统。(3)为了测试本文系统的可行性,在室外环境下进行了一系列实验。实验结果表明,本系统的方案合理有效,能够较好的实现声源定位。此外,针对本系统在实际环境中存在的不足之处,文中也给出了相关的改进方案,为更有效的声源定位系统的研发提供了思路。
【关键词】:麦克风阵列 声源定位 四元十字阵 时延估计
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 摘要4-5
- Abstract5-12
- 第一章 绪论12-18
- 1.1 课题研究的背景与意义12
- 1.2 国内外研究现状12-14
- 1.2.1 国外研究现状12-13
- 1.2.2 国内研究现状13-14
- 1.3 基于麦克风阵列的声源定位技术14-15
- 1.3.1 基于高分辨率谱估计的声源定位14
- 1.3.2 基于可控波束形成的声源定位14-15
- 1.3.3 基于时延估计的声源定位15
- 1.4 本文的主要内容及组织结构15-18
- 第二章 基于麦克风阵列的声源定位算法的研究18-44
- 2.1 麦克风阵列信号的模型及拓扑结构18-21
- 2.1.1 远场模型18
- 2.1.2 近场模型18-19
- 2.1.3 麦克风阵列的拓扑结构19-21
- 2.2 基于时延估计的声源定位原理21-30
- 2.2.1 基于四元十字阵的声源定位算法22-24
- 2.2.2 时延估计算法的基本模型24-25
- 2.2.3 基本互相关法25-26
- 2.2.4 广义互相关法26-27
- 2.2.5 最小均方(LMS)自适应滤波法27-29
- 2.2.6 多通道加权联合法29-30
- 2.3 仿真实验30-42
- 2.3.1 广义互相关算法32-37
- 2.3.2 多通道加权联合算法37-42
- 2.4 本章小结42-44
- 第三章 声源定位系统的硬件设计44-66
- 3.1 系统总体框图44
- 3.2 最小系统44-52
- 3.2.1 基于ARM Cortex-A8架构的S5PV210处理器45-47
- 3.2.2 DDR2 SDRAM47-49
- 3.2.3 NAND Flash49-50
- 3.2.4 电源模块50-51
- 3.2.5 时钟模块51-52
- 3.2.6 复位电路52
- 3.3 麦克风阵列模块52-54
- 3.3.1 麦克风种类选择52-53
- 3.3.2 麦克风阵元间距53
- 3.3.3 麦克风阵列的结构53-54
- 3.4 音频编码解码模块54-58
- 3.4.1 WM8960电路设计55-56
- 3.4.2 IIC总线56-58
- 3.4.3 IIS总线58
- 3.5 SD卡模块58-59
- 3.6 USB模块59-61
- 3.6.1 USB HUB扩展电路59-60
- 3.6.2 USB OTG接口60-61
- 3.7 串口模块61
- 3.8 电源模块61-64
- 3.8.1 5V电源设计61
- 3.8.2 3.3V电源设计61-64
- 3.9 本章小结64-66
- 第四章 声源定位系统的软件开发66-86
- 4.1 嵌入式Linux系统的构建66-70
- 4.1.1 Linux系统简介66
- 4.1.2 Linux内核体系结构66-67
- 4.1.3 Linux内核代码结构67-69
- 4.1.4 Linux内核镜像的制作69-70
- 4.2 音频驱动程序的移植70-79
- 4.2.1 高级Linux声音架构70-71
- 4.2.2 Platform功能和数据解析71-72
- 4.2.3 Codec功能和数据解析72-73
- 4.2.4 WM8960芯片的驱动移植73-79
- 4.3 音频采集程序的设计79-80
- 4.4 声源定位算法的设计80-85
- 4.4.1 信号预处理80-82
- 4.4.2 语音端点检测82-84
- 4.4.3 时延算法设计84-85
- 4.5 本章小结85-86
- 第五章 系统测试及分析86-92
- 5.1 测试设备及环境86-87
- 5.2 测试方法与步骤87-89
- 5.3 测试结果与分析89-91
- 5.4 误差分析91
- 5.5 改进方案91
- 5.6 本章小结91-92
- 第六章 总结与展望92-93
- 6.1 工作总结92
- 6.2 研究展望92-93
- 致谢93-94
- 参考文献94-98
- 攻读硕士学位期间发表的论文98
【相似文献】
中国期刊全文数据库 前10条
1 沈常宇;郭宝金;姜守军;蒋坤军;;小区域高精度实时三维声源定位系统[J];声学技术;2007年05期
2 郑珍珍;冯华君;沈常宇;丁驰竹;李奇;;基于坐标系变换的三维声源定位算法[J];浙江大学学报(工学版);2008年02期
3 李彦翔;刘庆华;;高斯条件下基于粒子滤波的声源定位[J];电声技术;2009年10期
4 杨杰;张明路;;一种改进的声源目标成型波定位方法的研究[J];河北工业大学学报;2009年05期
5 袁余民;廖海龙;;可移动声源定位系统的研究与实现[J];信息系统工程;2010年01期
6 赵立业;李宏生;;噪声与共振环境下的数字助听器鲁棒声源定位法(英文)[J];Transactions of Nanjing University of Aeronautics & Astronautics;2010年02期
7 李彦翔;刘庆华;;基于粒子滤波的声源定位方法[J];计算机工程与应用;2010年30期
8 陈益如;王博;邬杨波;;基于声音导引的声源定位系统设计[J];工业控制计算机;2010年10期
9 张志勇;高宝成;;一种分布式的声源定位系统[J];数据采集与处理;2010年S1期
10 雷斌;孙舟;;分布式声源定位算法实现[J];西安工业大学学报;2011年02期
中国重要会议论文全文数据库 前10条
1 汪增福;刘克辉;王东;韩文善;;基于声压幅度比的声源定位[A];2001年中国智能自动化会议论文集(下册)[C];2001年
2 饶丹;谢菠荪;;声源指向性对双耳可听化质量的影响[A];2005年声频工程学术交流会论文集[C];2005年
3 饶丹;谢菠荪;;声源指向性对双耳可听化质量的影响[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
4 沈常宇;郭宝金;姜守军;蒋坤军;;小区域高精度实时三维声源定位系统[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
5 原晶晶;;3-7岁正常儿童声源定位能力的研究[A];2010全国耳鼻咽喉头颈外科中青年学术会议论文汇编[C];2010年
6 全海英;张旭;邓军民;于红玉;徐瑾;孙涌;何宝新;水玉海;王宁宇;;声源定位测听系统的设计[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
7 刘哲;陈日林;罗伦楷;滕鹏晓;杨亦春;;探测距离对声源定位精度的影响[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
8 黄益旺;杨士莪;吕钱浩;;基于时延的匹配场声源定位[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 刘红云;刘桂礼;罗倩;;基于改进时延估计的声源定位方法实现[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
10 朱胜佳;任海鹏;;基于混沌共轭梯度法的二维声源定位方法研究[A];2010振动与噪声测试峰会论文集[C];2010年
中国重要报纸全文数据库 前1条
1 李函;人是如何定位声源的?[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 王子腾;高速车辆的声源定量识别方法[D];清华大学;2014年
2 杨志国;马尔可夫状态—空间模型下的声源定位与跟踪[D];浙江大学;2013年
3 周成;人耳声源定位与编码技术研究[D];武汉大学;2011年
4 刘松;基于相位共轭方法进行声源识别和定位[D];大连理工大学;2011年
5 黄益旺;浅海远距离匹配场声源定位研究[D];哈尔滨工程大学;2005年
6 张承云;虚拟听觉环境实时绘制系统平台研究[D];华南理工大学;2012年
7 陈韶华;海洋声源信息获取与传输技术研究[D];西北工业大学;2006年
8 徐勤奇;基于正四面体传声器阵列的机器人声源定位方法研究[D];河北工业大学;2014年
9 饶丹;双耳可听化质量及其影响因素的研究[D];华南理工大学;2009年
10 汤永清;空间听觉特征提取与3D音频再现研究[D];上海大学;2011年
中国硕士学位论文全文数据库 前10条
1 李贺;基于波束形成算法的声源定位研究及DSP实现[D];南京信息工程大学;2015年
2 刘慧珠;基于麦克风阵列的声源方位估计算法研究[D];西南交通大学;2015年
3 薛伟诚;锯齿尾缘翼型降噪实验研究[D];中国科学院研究生院(工程热物理研究所);2015年
4 肖骏;基于麦克风阵列的实时声源定位技术研究[D];电子科技大学;2015年
5 刘茜茜;基于人耳听觉系统的盲声源分离方法研究[D];电子科技大学;2015年
6 李扬;基于小型麦克风阵列的声源定位系统设计与实现[D];哈尔滨工业大学;2014年
7 李哲;声源定位系统的设计与实现[D];河北科技大学;2015年
8 仲维灿;不确定性条件下机器人声源定位模型研究[D];河北工业大学;2015年
9 杨博元;传感器声源目标定位算法研究[D];西安工业大学;2013年
10 徐亦达;时变海洋声速剖面移动声源反演方法研究[D];浙江大学;2015年
,本文编号:645915
本文链接:https://www.wllwen.com/kejilunwen/wltx/645915.html