基于改进语音特征与极限学习机的语音端点检测
发布时间:2020-12-11 04:06
语音端点检测(Voice Activity Detection,VAD),是指在给定语音信号帧中判别语音是否存在,鲁棒的VAD有助于提高语音应用的自动化效率,例如语音增强、说话人识别、助听器等.为了提高低信噪比下语音端点检测的精度以及效率,提出了一种新的语音特征—低频消噪能量(Low Frequency De-noising Energy,LFDE),将其应用于VAD中,并利用LFDE与现有的声学特征(梅尔频率倒谱参数、共振峰频率)结合训练极限学习机(Extreme Learning Machine, ELM)分类器.仿真实验发现,端点检测的精度与效率都有提高.
【文章来源】:微电子学与计算机. 2020年03期 第37-41页 北大核心
【文章页数】:5 页
【部分图文】:
原始语音信号与具有5dB信噪比的噪声语音信号波形
图1 原始语音信号与具有5dB信噪比的噪声语音信号波形使用移动平均滤波器过滤之后,从LF对数能量谱减去HF平均对数能量谱,可以得到图3,图3中语音的起点与终点可以清晰地得出(阈值设置为0.05).
使用移动平均滤波器过滤之后,从LF对数能量谱减去HF平均对数能量谱,可以得到图3,图3中语音的起点与终点可以清晰地得出(阈值设置为0.05).为了进一步验证提出的特征对于VAD的效用,在图1原始语音信号中添加了不同水平的噪声,信噪比分别为15 dB、10 dB、3 dB和0 dB,测试结果如图4所示,结果表明对于不同的低信噪比语音信号,VAD结果几乎相同,而当信噪比小于5 dB时,LFDE需要相应的阈值来进一步确定端点,此时阈值设置为0.5,该方法性能良好.
【参考文献】:
期刊论文
[1]基于Teager能量算子和经验模态分解的语音端点检测算法[J]. 沈希忠,郑晓修. 电子与信息学报. 2018(07)
[2]基于多特征融合与动态阈值的语音端点检测方法[J]. 朱春利,李昕. 计算机工程. 2019(02)
[3]基于共振峰谐波能量的语音端点检测[J]. 刘红星,戴蓓蒨,陆伟. 清华大学学报(自然科学版). 2008(S1)
本文编号:2909879
【文章来源】:微电子学与计算机. 2020年03期 第37-41页 北大核心
【文章页数】:5 页
【部分图文】:
原始语音信号与具有5dB信噪比的噪声语音信号波形
图1 原始语音信号与具有5dB信噪比的噪声语音信号波形使用移动平均滤波器过滤之后,从LF对数能量谱减去HF平均对数能量谱,可以得到图3,图3中语音的起点与终点可以清晰地得出(阈值设置为0.05).
使用移动平均滤波器过滤之后,从LF对数能量谱减去HF平均对数能量谱,可以得到图3,图3中语音的起点与终点可以清晰地得出(阈值设置为0.05).为了进一步验证提出的特征对于VAD的效用,在图1原始语音信号中添加了不同水平的噪声,信噪比分别为15 dB、10 dB、3 dB和0 dB,测试结果如图4所示,结果表明对于不同的低信噪比语音信号,VAD结果几乎相同,而当信噪比小于5 dB时,LFDE需要相应的阈值来进一步确定端点,此时阈值设置为0.5,该方法性能良好.
【参考文献】:
期刊论文
[1]基于Teager能量算子和经验模态分解的语音端点检测算法[J]. 沈希忠,郑晓修. 电子与信息学报. 2018(07)
[2]基于多特征融合与动态阈值的语音端点检测方法[J]. 朱春利,李昕. 计算机工程. 2019(02)
[3]基于共振峰谐波能量的语音端点检测[J]. 刘红星,戴蓓蒨,陆伟. 清华大学学报(自然科学版). 2008(S1)
本文编号:2909879
本文链接:https://www.wllwen.com/kejilunwen/wltx/2909879.html