基于耳蜗谱图纹理特征的声音事件识别
发布时间:2021-06-05 13:08
针对在各种环境下声音事件的识别问题,提出了一种基于谱图纹理特征的声音事件识别方法。首先,将声音信号通过伽马通(Gammatone)滤波器组,使原始声音样本转化为灰度耳蜗谱图;然后,对谱图进行曲波(Curvelet)变换,得到不同尺度、不同方向的Curvelet子带;再采用改进完全局部二值模式(ImprovedCompletedLocalBinaryPattern,ICLBP)提取Curvelet子带的纹理特征,并生成分块统计直方图,将统计直方图级联作为一种新的声音事件特征;最后,使用支持向量机作为分类器对16种声音事件在不同噪声和不同信噪比下进行识别。实验结果表明,所提特征与其他声音特征相比,可以有效识别各种噪声环境下不同种类的声音事件。
【文章来源】:声学技术. 2020,39(01)北大核心CSCD
【文章页数】:7 页
【部分图文】:
算法的流程框架图
Curvelet变换考虑了尺度、角度、位置信息,使其在表达图像中的曲线时明显优于小波变换。同时,Curvelet变换克服了小波变换的局限性,具有比小波变换更宽的几何特征。Curvelet变换之后得到的系数具有多尺度、多方向特点,能够更好地凸显图像像素间的变化。考虑到耳蜗谱图表征声音信息的有限性,而Curvelet变换的多尺度分析能力,将谱图分解为不同尺度层,各尺度层分别表示谱图不同频率的信息。这样,可以获取关于谱图的更多细节信息。设f(m,n)表示图像信号,则其基于Wrapping的离散Curvelet变换可表示为
同时,表3给出了4种噪声环境条件下,UCLBP_S/ICLBP_M特征与SPD等其他4种特征在不同信噪比下的平均识别率。从表3可知,当信噪比为0时,UCLBP_S/ICLBP_M特征的平均识别率达到80%,依然能够保持较高的识别率。且在4种信噪比下的平均识别率达到92.03%,比SPD特征、SIF特征、OMP+MFCC特征、MFCC特征分别高出6.06%、18.04%、40.49%、46.98%。从表3中的各特征对比说明,UCLBP_S/ICLBP_M特征是一个性能较好的特征,在不同噪声环境及不同信噪比条件下,仍然能取得较好的识别结果,具有较优的鲁棒性。这是因为Curvelet变换可以更好表示谱图中出现的边缘和其他变化,获取谱图中更多的细节信息。此外,使用UCLBP_S和ICLBP_M提取特征,串联得到融合的UCLBP_S/ICLBP_M特征,降低了特征维数,减少了特征冗余,从而使提取的特征更具有鉴别性。图4 信噪比为0时,babble噪声测试样本的混淆矩阵
【参考文献】:
期刊论文
[1]基于肺音谱图Hough变换的喘鸣音识别方法[J]. 张柯欣,龙哲,王雪峰,赵宏. 东北大学学报(自然科学版). 2017(11)
[2]用于水声目标识别的近邻无监督特征选择算法[J]. 陈含露,杨宏晖,申昇. 声学技术. 2016(03)
[3]类独立特征提取法在环境声音识别中的应用[J]. 李玲俐,陈晓明. 计算机工程与应用. 2012(22)
本文编号:3212228
【文章来源】:声学技术. 2020,39(01)北大核心CSCD
【文章页数】:7 页
【部分图文】:
算法的流程框架图
Curvelet变换考虑了尺度、角度、位置信息,使其在表达图像中的曲线时明显优于小波变换。同时,Curvelet变换克服了小波变换的局限性,具有比小波变换更宽的几何特征。Curvelet变换之后得到的系数具有多尺度、多方向特点,能够更好地凸显图像像素间的变化。考虑到耳蜗谱图表征声音信息的有限性,而Curvelet变换的多尺度分析能力,将谱图分解为不同尺度层,各尺度层分别表示谱图不同频率的信息。这样,可以获取关于谱图的更多细节信息。设f(m,n)表示图像信号,则其基于Wrapping的离散Curvelet变换可表示为
同时,表3给出了4种噪声环境条件下,UCLBP_S/ICLBP_M特征与SPD等其他4种特征在不同信噪比下的平均识别率。从表3可知,当信噪比为0时,UCLBP_S/ICLBP_M特征的平均识别率达到80%,依然能够保持较高的识别率。且在4种信噪比下的平均识别率达到92.03%,比SPD特征、SIF特征、OMP+MFCC特征、MFCC特征分别高出6.06%、18.04%、40.49%、46.98%。从表3中的各特征对比说明,UCLBP_S/ICLBP_M特征是一个性能较好的特征,在不同噪声环境及不同信噪比条件下,仍然能取得较好的识别结果,具有较优的鲁棒性。这是因为Curvelet变换可以更好表示谱图中出现的边缘和其他变化,获取谱图中更多的细节信息。此外,使用UCLBP_S和ICLBP_M提取特征,串联得到融合的UCLBP_S/ICLBP_M特征,降低了特征维数,减少了特征冗余,从而使提取的特征更具有鉴别性。图4 信噪比为0时,babble噪声测试样本的混淆矩阵
【参考文献】:
期刊论文
[1]基于肺音谱图Hough变换的喘鸣音识别方法[J]. 张柯欣,龙哲,王雪峰,赵宏. 东北大学学报(自然科学版). 2017(11)
[2]用于水声目标识别的近邻无监督特征选择算法[J]. 陈含露,杨宏晖,申昇. 声学技术. 2016(03)
[3]类独立特征提取法在环境声音识别中的应用[J]. 李玲俐,陈晓明. 计算机工程与应用. 2012(22)
本文编号:3212228
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3212228.html