基于阈值的英语语音自动识别系统研究
发布时间:2021-03-25 03:44
语音识别系统的关键在于噪声的处理,主要包含两个阶段,即基于阈值的噪声检测和降噪处理,主要用于英语等语言的自动识别处理。在噪声检测阶段,系统基于所收集的语音的信噪比(SNR)值自动确定何时提高语音质量;在降噪处理阶段,采用独立分量分析(ICA)和子空间语音增强(SSE)来降低噪声。通过实验证明增强语音的SNR值超过接收到的噪声语音的SNR值约20dB至25dB,降噪程序将语音识别率提高了约15%至25%,因此该系统能够降低噪声对多种噪声环境的影响,提高语音质量,达到英语语音识别的目的。
【文章来源】:微型电脑应用. 2020,36(08)
【文章页数】:3 页
【部分图文】:
基于阈值的噪声检测的过程图
为了验证所提算法的有效性,采用16-DOF RobotinnoTM的人形机器人。对于线性阵列,在人形机器人的肩部上放置两个间隔为0.1m的全向麦克风,测试环境的布局图,如图2所示。实验室的长度和宽度分别为7米和6米;线性阵列以8 kHz的采样率收集测试语音信号;从机器人到扬声器的距离为1.5米,从机器人到噪声源的距离为2米。SNR阈值ε设置为10。在实验中,三个测试方向(30°,60°和90°)用于收集语音信号,三个方向(45°,90°和135°)用于记录噪声信号。
有噪声语音的语音识别率,如图3所示。与文献[6-7]的研究方法与所提出的基于HMM的系统进行比较。在实验中检查了具有0 dB,5 dB和10 dB的有噪声语音的三个SNR值。 结果表明,该方法可以比噪声语音提高识别率约15%至25%,证明所提出的采用组合噪声分离和语音增强方法的系统可以有效地去除多种类型的噪声,提高语音识别过程的语音质量。
本文编号:3098956
【文章来源】:微型电脑应用. 2020,36(08)
【文章页数】:3 页
【部分图文】:
基于阈值的噪声检测的过程图
为了验证所提算法的有效性,采用16-DOF RobotinnoTM的人形机器人。对于线性阵列,在人形机器人的肩部上放置两个间隔为0.1m的全向麦克风,测试环境的布局图,如图2所示。实验室的长度和宽度分别为7米和6米;线性阵列以8 kHz的采样率收集测试语音信号;从机器人到扬声器的距离为1.5米,从机器人到噪声源的距离为2米。SNR阈值ε设置为10。在实验中,三个测试方向(30°,60°和90°)用于收集语音信号,三个方向(45°,90°和135°)用于记录噪声信号。
有噪声语音的语音识别率,如图3所示。与文献[6-7]的研究方法与所提出的基于HMM的系统进行比较。在实验中检查了具有0 dB,5 dB和10 dB的有噪声语音的三个SNR值。 结果表明,该方法可以比噪声语音提高识别率约15%至25%,证明所提出的采用组合噪声分离和语音增强方法的系统可以有效地去除多种类型的噪声,提高语音识别过程的语音质量。
本文编号:3098956
本文链接:https://www.wllwen.com/kejilunwen/wltx/3098956.html