当前位置:主页 > 科技论文 > 信息工程论文 >

基于听皮层神经元感受野的强噪声环境下说话人识别

发布时间:2023-06-13 21:03
  针对说话人识别易受环境噪声影响的问题,借鉴生物听皮层神经元频谱-时间感受野(STRF)的时空滤波机制,提出一种新的声纹特征提取方法。在该方法中,对基于STRF获得的听觉尺度-速率图进行了二次特征提取,并与传统梅尔倒谱系数(MFCC)进行组合,获得了对环境噪声具有强容忍的声纹特征。采用支持向量机(SVM)作为分类器,对不同信噪比(SNR)语音数据进行测试的结果表明,基于STRF的特征对噪声的鲁棒性普遍高于MFCC系数,但识别正确率较低;组合特征提升了语音识别的正确率,同时对环境噪声具有良好的鲁棒性。该结果说明所提方法在强噪声环境下说话人识别上是有效的。

【文章页数】:7 页

【文章目录】:
0 引言
1 算法原理
2 本文方法
    2.1 语音信号的预处理
    2.2 声纹特征提取
        2.2.1 基于STRF的声纹特征
        2.2.2 MFCC系数
        2.2.3 基于MFCC和STRF组合特征
    2.3 分类器的选取
3 实验与结果分析
    3.1 数据来源
    3.2 单一特征对识别结果的影响
    3.3 组合特征对识别结果的影响
    3.4 不同特征对环境噪声的鲁棒性分析
4 结语



本文编号:3833292

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3833292.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c5523***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com