基于智能移动终端的音频场景检测方法研究
发布时间:2021-10-26 09:15
智能移动终端的场景识别是智能化机器研究的重要分支,在终端定位导航、路径规划和安防监控等方面具有广阔的应用前景。基于音频的场景识别不仅能解决图像处理计算周期长和动态性能差等问题,还具有不受光线变化干扰的特点。智能移动终端配备高灵敏度传感器、大容量内存和高性能CPU,不仅可采集音频信号,还能满足存储和处理音频信号的需要,因此基于智能移动终端的音频场景检测方法研究具有重要意义。本研究首先在智能移动终端上设计了一个应用程序,实现实时音频信号采集、降噪和端点检测。针对传统小波软阈值函数的系数存在恒定偏差和硬阈值函数容易在信号突变处出现伪吉布斯现象的问题,提出了一种新的小波阈值函数来提高降噪效果,新阈值函数在阈值点处连续并且引入了一个指数型收缩因子。采用信噪比作为降噪效果的评价指标,实验证明表明采用新阈值函数对实时音频信号降噪后信噪比可达19.47dB,比传统软硬阈值去噪法的信噪比提高了5dB。为判断采集音频信号的质量和去除静音段,对降噪后的音频信号进行端点检测,采用端点标记正确率作为端点检测效果的评价指标。实验表明,基于改进谱熵的端点检测正确率为90.03%。在借助DCASE数据库提供的音频信号...
【文章来源】:西南科技大学四川省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
研究流程
音频信号采集及检测9图2-1研究流程Figure2-1Researchprocess该款智能手机在顶部和底部各有一个麦克风可以实现双通道音频信号采集。采集音频时顶部和底部麦克风距离音源的距离不同,所以两个麦克风的拾音量大小不同,并存在一定的时延。手机麦克风位置如图2-2所示。图2-2手机麦克风位置Figure2-2Mobilephonemicrophoneposition智能手机的配置情况会影响音频信号的采集和处理效率,本研究采用基于Android9.0操作系统的智能手机,内存能满足各种实验数据存储变化的需求。该手机的配置信息参见下表2-1所示。
西南科技大学硕士学位论文10表2-1实验智能手机配置信息表Table2-1ExperimentalsmartphoneconfigurationRedmiNote8Pro主要配置信息内存大小RAM:8GB;ROM:256GB操作系统Android9.0;MIUI10处理器CPU:MTKhelioG90T;GPU:Mali-G76MC4在本研究中手机终端作为音频信号采集和前期处理的设备,在实验过程中设计一个专门的手机应用程序可以实现数据可视化和结果输出,该应用程序可以很大程度上方便用户的使用。在智能移动终端设备上的APP用户界面如图2-3所示。(a)(b)(c)(d)(e)图2-3手机终端上的APP用户界面Figure2-3APPuserinterfaceonthemobileterminal
【参考文献】:
期刊论文
[1]基于新阈值函数的小波阈值去噪方法研究[J]. 宿常鹏,王雪梅,许哲,李骏霄. 战术导弹技术. 2020(03)
[2]基于小波谱图和深度卷积网络的音频场景识别新框架[J]. 陈航艇. 网络新媒体技术. 2019(02)
[3]深浅层特征及模型融合的说话人识别[J]. 仲伟峰,方祥,范存航,温正棋,陶建华. 声学学报. 2018(02)
[4]语音识别技术的发展[J]. 王致信,胡文东. 网友世界. 2013(13)
[5]公共场所典型异常声音的特征提取[J]. 栾少文,龚卫国. 计算机工程. 2010(07)
[6]基于MFCC和短时能量混合的异常声音识别算法[J]. 吕霄云,王宏霞. 计算机应用. 2010(03)
[7]语音识别技术的研究与发展[J]. 王敏妲. 微型机与应用. 2009(23)
[8]语音识别技术研究进展[J]. 詹新明,黄南山,杨灿. 现代计算机(专业版). 2008(09)
[9]语音识别技术研究进展[J]. 柳春. 甘肃科技. 2008(09)
[10]语音识别技术的发展现状及应用前景[J]. 高新涛,陈乖丽. 甘肃科技纵横. 2007(04)
硕士论文
[1]基于卷积神经网络的音频场景分类方法研究[D]. 孙凌山.成都理工大学 2019
[2]音频场景分析与识别方法研究[D]. 杨丽.南京大学 2013
[3]基于尺度噪声能量估计的自适应语音去噪算法及其软件实现[D]. 谢巍盛.上海交通大学 2012
[4]基于DSP的语音信号识别系统的研究与实现[D]. 陈涛.成都理工大学 2010
[5]基于MFCC与IMFCC的说话人识别研究[D]. 刘丽岩.哈尔滨工程大学 2008
本文编号:3459246
【文章来源】:西南科技大学四川省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
研究流程
音频信号采集及检测9图2-1研究流程Figure2-1Researchprocess该款智能手机在顶部和底部各有一个麦克风可以实现双通道音频信号采集。采集音频时顶部和底部麦克风距离音源的距离不同,所以两个麦克风的拾音量大小不同,并存在一定的时延。手机麦克风位置如图2-2所示。图2-2手机麦克风位置Figure2-2Mobilephonemicrophoneposition智能手机的配置情况会影响音频信号的采集和处理效率,本研究采用基于Android9.0操作系统的智能手机,内存能满足各种实验数据存储变化的需求。该手机的配置信息参见下表2-1所示。
西南科技大学硕士学位论文10表2-1实验智能手机配置信息表Table2-1ExperimentalsmartphoneconfigurationRedmiNote8Pro主要配置信息内存大小RAM:8GB;ROM:256GB操作系统Android9.0;MIUI10处理器CPU:MTKhelioG90T;GPU:Mali-G76MC4在本研究中手机终端作为音频信号采集和前期处理的设备,在实验过程中设计一个专门的手机应用程序可以实现数据可视化和结果输出,该应用程序可以很大程度上方便用户的使用。在智能移动终端设备上的APP用户界面如图2-3所示。(a)(b)(c)(d)(e)图2-3手机终端上的APP用户界面Figure2-3APPuserinterfaceonthemobileterminal
【参考文献】:
期刊论文
[1]基于新阈值函数的小波阈值去噪方法研究[J]. 宿常鹏,王雪梅,许哲,李骏霄. 战术导弹技术. 2020(03)
[2]基于小波谱图和深度卷积网络的音频场景识别新框架[J]. 陈航艇. 网络新媒体技术. 2019(02)
[3]深浅层特征及模型融合的说话人识别[J]. 仲伟峰,方祥,范存航,温正棋,陶建华. 声学学报. 2018(02)
[4]语音识别技术的发展[J]. 王致信,胡文东. 网友世界. 2013(13)
[5]公共场所典型异常声音的特征提取[J]. 栾少文,龚卫国. 计算机工程. 2010(07)
[6]基于MFCC和短时能量混合的异常声音识别算法[J]. 吕霄云,王宏霞. 计算机应用. 2010(03)
[7]语音识别技术的研究与发展[J]. 王敏妲. 微型机与应用. 2009(23)
[8]语音识别技术研究进展[J]. 詹新明,黄南山,杨灿. 现代计算机(专业版). 2008(09)
[9]语音识别技术研究进展[J]. 柳春. 甘肃科技. 2008(09)
[10]语音识别技术的发展现状及应用前景[J]. 高新涛,陈乖丽. 甘肃科技纵横. 2007(04)
硕士论文
[1]基于卷积神经网络的音频场景分类方法研究[D]. 孙凌山.成都理工大学 2019
[2]音频场景分析与识别方法研究[D]. 杨丽.南京大学 2013
[3]基于尺度噪声能量估计的自适应语音去噪算法及其软件实现[D]. 谢巍盛.上海交通大学 2012
[4]基于DSP的语音信号识别系统的研究与实现[D]. 陈涛.成都理工大学 2010
[5]基于MFCC与IMFCC的说话人识别研究[D]. 刘丽岩.哈尔滨工程大学 2008
本文编号:3459246
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3459246.html