基于耳蜗谱图纹理特征的声音事件识别

发布时间：2021-06-05 13:08

　　针对在各种环境下声音事件的识别问题,提出了一种基于谱图纹理特征的声音事件识别方法。首先,将声音信号通过伽马通（Gammatone）滤波器组,使原始声音样本转化为灰度耳蜗谱图;然后,对谱图进行曲波（Curvelet）变换,得到不同尺度、不同方向的Curvelet子带;再采用改进完全局部二值模式（ImprovedCompletedLocalBinaryPattern,ICLBP）提取Curvelet子带的纹理特征,并生成分块统计直方图,将统计直方图级联作为一种新的声音事件特征;最后,使用支持向量机作为分类器对16种声音事件在不同噪声和不同信噪比下进行识别。实验结果表明,所提特征与其他声音特征相比,可以有效识别各种噪声环境下不同种类的声音事件。

【文章来源】：声学技术. 2020,39(01)北大核心CSCD

【文章页数】：7 页

【部分图文】：

基于耳蜗谱图纹理特征的声音事件识别

算法的流程框架图

谱图,耳蜗,声谱图,谱图

Curvelet变换考虑了尺度、角度、位置信息，使其在表达图像中的曲线时明显优于小波变换。同时，Curvelet变换克服了小波变换的局限性，具有比小波变换更宽的几何特征。Curvelet变换之后得到的系数具有多尺度、多方向特点，能够更好地凸显图像像素间的变化。考虑到耳蜗谱图表征声音信息的有限性，而Curvelet变换的多尺度分析能力，将谱图分解为不同尺度层，各尺度层分别表示谱图不同频率的信息。这样，可以获取关于谱图的更多细节信息。设f(m,n)表示图像信号，则其基于Wrapping的离散Curvelet变换可表示为

谱图,识别率,信噪比,噪声

同时，表3给出了4种噪声环境条件下，UCLBP＿S/ICLBP＿M特征与SPD等其他4种特征在不同信噪比下的平均识别率。从表3可知，当信噪比为0时，UCLBP＿S/ICLBP＿M特征的平均识别率达到80%，依然能够保持较高的识别率。且在4种信噪比下的平均识别率达到92.03%，比SPD特征、SIF特征、OMP+MFCC特征、MFCC特征分别高出6.06%、18.04%、40.49%、46.98%。从表3中的各特征对比说明，UCLBP＿S/ICLBP＿M特征是一个性能较好的特征，在不同噪声环境及不同信噪比条件下，仍然能取得较好的识别结果，具有较优的鲁棒性。这是因为Curvelet变换可以更好表示谱图中出现的边缘和其他变化，获取谱图中更多的细节信息。此外，使用UCLBP＿S和ICLBP＿M提取特征，串联得到融合的UCLBP＿S/ICLBP＿M特征，降低了特征维数，减少了特征冗余，从而使提取的特征更具有鉴别性。图4 信噪比为0时，babble噪声测试样本的混淆矩阵

【参考文献】：
期刊论文
[1]基于肺音谱图Hough变换的喘鸣音识别方法[J]. 张柯欣,龙哲,王雪峰,赵宏.  东北大学学报(自然科学版). 2017(11)
[2]用于水声目标识别的近邻无监督特征选择算法[J]. 陈含露,杨宏晖,申昇.  声学技术. 2016(03)
[3]类独立特征提取法在环境声音识别中的应用[J]. 李玲俐,陈晓明.  计算机工程与应用. 2012(22)

本文编号：3212228

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3212228.html

上一篇：分布式光纤振动温度融合传感技术研究
下一篇：双通道可重构14 bit 125 MS/s流水线ADC

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|