感知听觉场景分析的说话人识别
发布时间:2017-12-07 13:03
本文关键词:感知听觉场景分析的说话人识别
更多相关文章: 说话人识别 缺失数据 感知特性 信噪比 语音增强 含噪语音 特征方法 场景分析 特征提取 语音段
【摘要】:针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能。实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别。
【作者单位】: 苏州大学物理与光电·能源学部;苏州大学电子信息学院;
【基金】:国家自然科学基金(61271359,61372146) 江苏省自然科学青年基金(BK20140354)资助
【分类号】:TN912.34
【正文快照】: 现实中,说话人识别系统受制于输入语音中W噪声,性能降低。i只别率随着噪声的增加而急剧下降W。早期的,解决说话人识别鲁棒性的典型方法可以分为以特征为基础的、以分数为基础的,和以模型为基础财法。m,
本文编号:1262459
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1262459.html