基于HMM和DNN混合模型研究的语音识别技术
发布时间:2024-06-29 00:14
随着大数据和人工智能的快速发展,语音识别的相关应用变得越来越普及,如今很多电子产品都通过语音交互进行操作,这让人们更加方便地享受到了现代化智能服务。如何更加高效的实现语音交互,减少噪声对系统识别性能的影响,提高系统的识别准确性是研究的重点所在。本文首先研究了语音信号的预处理和特征参数提取过程,针对梅尔频率倒谱系数(MFCC)只能反映声音信号的静态特性,而经验模态分解(EMD)能够更细致地刻画信号的非平稳特性,本文将EMD融入到MFCC特征提取中。实验结果表明,改进的特征参数提取方法有效地提高了系统的识别效果,在不同的信噪比下识别率最大提高了3.15%。在传统的声学建模中,高斯混合模型(GMM)和隐马尔科夫(HMM)混合模型一直占主导地位,本文在MATLAB上建立小词汇量识别系统进行实验,对比分析可得GMM-HMM相对于单一的HMM来说,对训练数据量的要求不高且具有更好的识别性能。针对GMM对复杂数据的建模能力不足的问题,在此混合模型的基础上采用具有更强建模能力的深度神经网络(DNN)来代替GMM得到新的模型结构,在Linux系统上创建kaldi语音识别工具箱,基于THCHS-30语音数...
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
本文编号:3996873
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图1-1未来语音交互市场发展趋势
2右。图1-1未来语音交互市场发展趋势随着5G技术的到来以及物联网的推广,人工智能将再次掀起科技前沿的浪潮,语音识别作为其中最重要的一环,具有非常广阔的市场应用前景。目前很多行业可能还没有意识到语音识别技术所带来的改革力量,但是就现在的发展形势而言,这项技术的广泛应用,在未来人类....
图1-2语音识别基本框图
3图1-2语音识别基本框图人类对语音识别的研究和探索始于20世纪50年代。1952年,贝尔实验室的Davis等人利用模拟电子器件完成了最早的识别系统Audrey,该系统是基于特定人的孤立词识别,提取发音中每个元音的共振峰信息,然后通过简单的模板匹配实现的[5],能够准确识别10个....
图2-1语音识别技术原理图
9第2章语音信号的分析和预处理对语音信号进行分析和预处理是语音识别的基础环节,对后续的识别来说是至关重要的一步。预处理操作可以有效地减少噪声和无关信息的干扰,有利于提取到最有用的特征信息。2.1语音识别基本原理语音识别属于模式识别的范畴,其过程主要分为训练和识别两个阶段。具体过程....
图2-2单个斜三角波及其频谱
10Rosenberg观察出这种脉冲波几近于斜三角形的脉冲波,也就是说,可以把间断的脉冲波作为一个由多个斜三角形波构成脉冲串,并且以基音周期为周期。单个斜三角波的表达式为:()()()11121121/21cos/,0cos/2,0,nNnNgnnNNNnNNππ≤≤=≤≤+其他....
本文编号:3996873
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3996873.html