当前位置:主页 > 科技论文 > 网络通信论文 >

基于卷积神经网络的语音端点检测方法研究

发布时间:2024-03-27 19:17
  在语音识别系统中一项非常重要的预处理技术就是语音端点检测。语音端点检测,就是要从掺杂有复杂背景噪声的语音信号中,分离出语音信号和非语音信号,确定出语音信号的起始点和终止点。因此,作为语音识别系统的第一步,语音端点检测,尤其是噪声环境下的语音端点检测,是至关重要的,它的准确性在很大程度上直接影响着后续的识别工作能否有效进行。本文实现了一些常用的语音端点检测算法,并分析了其各自的优缺点。基于时域的短时能量和过零率的方法,结合了语音段的能量比噪声段的能量大,以及清音、鼻音、摩擦音等能量值较小的语音段的短时平均过零率值较高的优点,在纯净语音下可以得到较好的检测效果,但随着噪声的增大,该方法的检测效果也随之下降。基于信息熵的语音端点检测算法利用语音帧的信息熵值小于背景噪声帧的信息熵值的特点来进行语音端点检测,在低信噪比下仍可以得到较好的效果,但对于某些噪声,检测结果较差。基于短时能频值的语音端点检测算法将时域和频域特征参数结合在一起,实验表明,在噪声环境下也可较好的进行语音端点检测,但没有很好的方法来确定门限值。针对上述三种方法的不足,本文将卷积神经网络应用到语音端点检测算法中,以连续的几个语音...

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

图2.1汉明窗波形图??

图2.1汉明窗波形图??

典型的语音信号特性是随着时间的变化而变化的,例如,随着咽、口腔、鼻腔这些??声道的变化,会使信号的共振峰有很大的变化;在声带振动和声带不振动时,会使语音??的幅度值有很大的变化。在一个语音信号的波形图中,这些变化十分明显,图2.2为语??音"制约俄国巩固西方在东欧的立足点”的波形....


图2.2语音波形示例??Figure?2.2?The?speech?waveform?example??

图2.2语音波形示例??Figure?2.2?The?speech?waveform?example??

??1.滤波器组分析方法??滤波器组分析方法是通过使用一组滤波器来进行频谱分析的方法,其原理如图2.3??所示。??_油玻器乂?h-?AAvA^??AAAA/—滤坡器/,?—?aa/\/\/??H?酬/.?h?"AaA/V??图2.3滤波器组分析方法原理图??Figure?2.3....


图2.4快速傅里叶变换频谱图??

图2.4快速傅里叶变换频谱图??

M为窗函数。从短时傅里叶变换提出以来,由于其计算量大、耗时长,所以??在很长的一段时间内并不能被应用到实际的工程项目中。基于此,人们提出了一种快速??傅里叶变换(Fast?Fourier?Transform,FFT)的方法,用来更快速的实现这一变换。图2.4??为语音“制约俄国巩....


图3.2基于短时能量的语音端点检测??Figure?3.2?Short?Energy?for?voice?activity?detection??

图3.2基于短时能量的语音端点检测??Figure?3.2?Short?Energy?for?voice?activity?detection??

图3.2基于短时能量的语音端点检测??Figure?3.2?Short?Energy?for?voice?activity?detection??但是,只使用短时能量进行端点切分的方法很不可靠,从图3.?2中可以看到,在“四”??字的开始部分和“语”字部分为清音,短时能量幅度比其....



本文编号:3940366

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3940366.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0f9aa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com