基于GMM-HMM的语音识别垃圾分类系统
发布时间:2021-11-25 02:15
垃圾分类对社会的可持续发展有着重大意义,然而由于垃圾种类的复杂性,分类时间成本高等问题严重阻碍了垃圾分类的普及,针对这些问题,设计并实现一种基于语音识别的垃圾分类系统,该系统利用梅尔频率倒谱系数方法对语音信号进行特征提取,同时通过隐马尔科夫原理对语音识别系统进行建模,利用提取的特征向量训练该模型,再利用维特比算法识别语音数据,最后通过实例验证该算法的正确性。
【文章来源】:现代计算机. 2020,(26)
【文章页数】:6 页
【部分图文】:
语音识别系统流程
一般的原始数字语音信号往往包含各种噪声,包括说话人唇齿碰撞的低频噪声,还有语音采样装置的电流毛刺,加上说话声音的大小都会影响到语音信号识别结果,所以在进行特征提取之前按,我们需要先对语音信号进行一些预处理,预处理流程图如图2所示。预处理总共分为4个步骤:中值滤波,归一化,预加重,分帧与加窗。中值滤波的目的在于消除由于语音采样电路本身性质引起的冲激信号、毛刺等噪声。
在经过分帧处理后,每一帧的截断处是不平滑的,不利于后续处理。解决办法是使用窗函数对截断处的不连续变化进行平滑,减少泄露,降低傅里叶变化后旁瓣强度,将能量集中在主瓣内。常用的窗函数以及对应基本指标如表1所示。处理语音信号一般采用边界平滑下降的海明窗[2],海明窗函数W(n)表达式为:
【参考文献】:
期刊论文
[1]语音信号的加窗傅里叶变换研究[J]. 徐坤玉,张彩珍,药雪崧. 山西师范大学学报(自然科学版). 2011(03)
本文编号:3517215
【文章来源】:现代计算机. 2020,(26)
【文章页数】:6 页
【部分图文】:
语音识别系统流程
一般的原始数字语音信号往往包含各种噪声,包括说话人唇齿碰撞的低频噪声,还有语音采样装置的电流毛刺,加上说话声音的大小都会影响到语音信号识别结果,所以在进行特征提取之前按,我们需要先对语音信号进行一些预处理,预处理流程图如图2所示。预处理总共分为4个步骤:中值滤波,归一化,预加重,分帧与加窗。中值滤波的目的在于消除由于语音采样电路本身性质引起的冲激信号、毛刺等噪声。
在经过分帧处理后,每一帧的截断处是不平滑的,不利于后续处理。解决办法是使用窗函数对截断处的不连续变化进行平滑,减少泄露,降低傅里叶变化后旁瓣强度,将能量集中在主瓣内。常用的窗函数以及对应基本指标如表1所示。处理语音信号一般采用边界平滑下降的海明窗[2],海明窗函数W(n)表达式为:
【参考文献】:
期刊论文
[1]语音信号的加窗傅里叶变换研究[J]. 徐坤玉,张彩珍,药雪崧. 山西师范大学学报(自然科学版). 2011(03)
本文编号:3517215
本文链接:https://www.wllwen.com/kejilunwen/wltx/3517215.html