基于机器学习与卷积神经网络的放电声音识别研究
发布时间:2024-06-02 14:59
为了实现对电气设备放电声音的精准检测,文中筛选比较了多种经典的机器学习算法和新兴的卷积神经网络算法,以期得到识别效果最优的选择。首先对音频进行预处理,再通过将放电声与环境噪声和变电站正常工况背景声混合来模拟变电站真实工作环境,并使用梅尔频率倒谱系数提取特征,最后采用支持向量机等机器学习算法与卷积神经网络算法进行识别,选取识别效果最佳的算法并考察不同采样频率、采样时长等因素对识别效果的影响。实验结果表明,使用梅尔频率倒谱系数提取特征可以良好区分放电与环境噪声,支持向量机在一系列算法中识别放电声音能力最强,采样频率、标准化方式等因素对识别效果影响较小。
【文章页数】:7 页
【部分图文】:
本文编号:3987408
【文章页数】:7 页
【部分图文】:
图1放电模拟模型
实验使用传感器采样频率为44100Hz,采样精度16位,频率响应与人耳可听声范围相同,为20~20000Hz。对于3种模型,在实验中均将传感器放置在离模型1.5m处,缓慢加压直至火花放电,观察室可见细微蓝光,并有“嗒嗒”响声,该阶段的波形见图2(a)。图2(a)中纵轴为....
图2放电声信号波形图
图1放电模拟模型通过以上实验合计收集原始的放电声音音频1601s。
图3放电声声谱图
朴素贝叶斯(NB)、随机森林(RF)、支持向量机(SVM)与K近邻(KNN)是几种常用的机器学习算法,广泛应用于文本分类,用户身份辨识等分类场景[26]。这几种算法对于输入数据的结构有着不同的假设和处理方式,因此需考察对比其与放电声音信号的匹配性。NB属于生成学习算法,根据输入x....
图4CNN模型结构
文中移植了TaraN.Sainath等人用于语音关键词识别的CNN模型,在对模型进行一定的修改后通过将音频转化为声谱图使用CNN进行识别[27]。模型结构见图4。图4由一层卷积层、两层全连接层和一层输出层组成。输入为(32,40,1)形状的声谱图,卷积层含有186个(32,8)....
本文编号:3987408
本文链接:https://www.wllwen.com/kejilunwen/dianlilw/3987408.html
教材专著