流媒体环境下英语口语发音自动校对方法研究
发布时间:2020-12-28 23:52
为了提高流媒体环境下英语口语发音自动校对能力,提出一种基于群延迟谱特征提取和智能语音识别的英语口语发音自动校对方法,构建流媒体环境下英语口语发音信号模型,采用声传感器进行流媒体环境下英语口语发音信号采集,对采集的语音信号采用群延迟估计方法进行时域相关性补偿和滤波检测,提取流媒体环境下英语口语发音信号的多参数统计特征量,采用连续数字语音识别方法进行英语口语发音的谱特征提取,分析提取的谱特征量的频谱差异性,采用语音结构化模型进行发音准确性校对和自适应反馈,提高了流媒体环境下英语口语发音自动校正能力。仿真结果表明,采用该方法能有效实现流媒体环境下英语口语发音自动校对,对语音信号的检测和参数估计性能较好。
【文章来源】:自动化与仪器仪表. 2020年07期
【文章页数】:4 页
【部分图文】:
流媒体环境下英语口语发音自动校正模型
为了测试本文方法在实现流媒体环境下英语口语发音校对和快速检测中的应用性能,进行仿真实验。实验采用Matlab 7设计,其中,对流媒体环境下英语口语音准点信号的采样频率为8 kHz,语音的声频带分布的带宽为20 ms,对声纹特征的初始采样频率为5 kHz,句子语料的信噪比为-15 dB、-5 dB和0 dB,输入的语音通道的频带为10 kHz~20 kHz、时宽为2 ms的LFM信号,在同一组信噪比条件下,对英语口语发音采样的帧长256,帧移120,根据上述仿真环境和参数设定,进行英语口语发音自动校对仿真分析,得到英语口语发音的测试信号和标准信号如图2所示。图2 英语口语发音的测试信号和标准发音语音信号
图2 英语口语发音的测试信号和标准发音语音信号以图2的发音信号为研究对象,对采集的语音信号采用群延迟估计方法进行时域相关性补偿和滤波检测,提取流媒体环境下英语口语发音信号的多参数统计特征量,得到特征提取结果如图3所示。
本文编号:2944599
【文章来源】:自动化与仪器仪表. 2020年07期
【文章页数】:4 页
【部分图文】:
流媒体环境下英语口语发音自动校正模型
为了测试本文方法在实现流媒体环境下英语口语发音校对和快速检测中的应用性能,进行仿真实验。实验采用Matlab 7设计,其中,对流媒体环境下英语口语音准点信号的采样频率为8 kHz,语音的声频带分布的带宽为20 ms,对声纹特征的初始采样频率为5 kHz,句子语料的信噪比为-15 dB、-5 dB和0 dB,输入的语音通道的频带为10 kHz~20 kHz、时宽为2 ms的LFM信号,在同一组信噪比条件下,对英语口语发音采样的帧长256,帧移120,根据上述仿真环境和参数设定,进行英语口语发音自动校对仿真分析,得到英语口语发音的测试信号和标准信号如图2所示。图2 英语口语发音的测试信号和标准发音语音信号
图2 英语口语发音的测试信号和标准发音语音信号以图2的发音信号为研究对象,对采集的语音信号采用群延迟估计方法进行时域相关性补偿和滤波检测,提取流媒体环境下英语口语发音信号的多参数统计特征量,得到特征提取结果如图3所示。
本文编号:2944599
本文链接:https://www.wllwen.com/waiyulunwen/waiguoyuyanwenhua/2944599.html