当前位置:主页 > 科技论文 > 网络通信论文 >

基于改进语音特征与极限学习机的语音端点检测

发布时间:2020-12-11 04:06
  语音端点检测(Voice Activity Detection,VAD),是指在给定语音信号帧中判别语音是否存在,鲁棒的VAD有助于提高语音应用的自动化效率,例如语音增强、说话人识别、助听器等.为了提高低信噪比下语音端点检测的精度以及效率,提出了一种新的语音特征—低频消噪能量(Low Frequency De-noising Energy,LFDE),将其应用于VAD中,并利用LFDE与现有的声学特征(梅尔频率倒谱参数、共振峰频率)结合训练极限学习机(Extreme Learning Machine, ELM)分类器.仿真实验发现,端点检测的精度与效率都有提高. 

【文章来源】:微电子学与计算机. 2020年03期 第37-41页 北大核心

【文章页数】:5 页

【部分图文】:

基于改进语音特征与极限学习机的语音端点检测


原始语音信号与具有5dB信噪比的噪声语音信号波形

语谱图,语音,语谱图,信噪比


图1 原始语音信号与具有5dB信噪比的噪声语音信号波形使用移动平均滤波器过滤之后,从LF对数能量谱减去HF平均对数能量谱,可以得到图3,图3中语音的起点与终点可以清晰地得出(阈值设置为0.05).

能量图,能量图,信噪比,能量谱


使用移动平均滤波器过滤之后,从LF对数能量谱减去HF平均对数能量谱,可以得到图3,图3中语音的起点与终点可以清晰地得出(阈值设置为0.05).为了进一步验证提出的特征对于VAD的效用,在图1原始语音信号中添加了不同水平的噪声,信噪比分别为15 dB、10 dB、3 dB和0 dB,测试结果如图4所示,结果表明对于不同的低信噪比语音信号,VAD结果几乎相同,而当信噪比小于5 dB时,LFDE需要相应的阈值来进一步确定端点,此时阈值设置为0.5,该方法性能良好.

【参考文献】:
期刊论文
[1]基于Teager能量算子和经验模态分解的语音端点检测算法[J]. 沈希忠,郑晓修.  电子与信息学报. 2018(07)
[2]基于多特征融合与动态阈值的语音端点检测方法[J]. 朱春利,李昕.  计算机工程. 2019(02)
[3]基于共振峰谐波能量的语音端点检测[J]. 刘红星,戴蓓蒨,陆伟.  清华大学学报(自然科学版). 2008(S1)



本文编号:2909879

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2909879.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ebc66***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com