基于HMM的特征元素语音几何建模方法研究与实验分析
发布时间:2019-08-14 11:48
【摘要】:语音识别技术在近些年得到了大力发展,并且语音识别在汽车工业、航空航天、信息通讯等领域有着越来越广泛的应用。现阶段常用的语音识别算法主要有动态时间规划算法、隐马尔科夫算法和人工神经网络算法。上述几种算法都存在着计算量大、识别时间长等不足,并且实际应用中极少有将语音识别应用于工业设计。针对上述方法中共同存在的不足,本文尝试了基于元音周期的语音识别算法,并将语音识别应用于三维几何建模。该算法根据元音序列特征进行模板匹配,在样本库相对固定时可大幅度降低计算量和识别时间。然而本方法准确率较现有算法(准确率可达95%)低,故在实际应用中,本课题仍使用隐马尔科夫算法进行自动语音几何建模。本文为工业设计中的人机交互方式提供了积极探索,因此,本文具有重要的应用价值。本文以三维建模软件的自动建模为应用目标,以隐马尔科夫算法作为语音识别的代表进行研究。围绕着设计自动化,本课题研究了“基于HMM的特征元素语音几何建模方法研究与实验分析”。本文内容主要包括:首先,本文对动态时间规划算法和隐马尔科夫算法的语音识别方法进行了研究。研究了上述两种算法的语音识别基本原理及相关技术,搭建了一个语音识别系统,对两种算法进行仿真,并对比分析实验结果,隐马尔科夫算法识别效率高于动态时间规划算法。本课题也对基于元音周期的语音识别算法进行了试验,结果表明仅靠元音信号的概率分布特性难以进行区分,导致用本算法进行语音识别时正确率低下。故本课题三维建模中的语音识别环节使用隐马尔科夫算法。其次,本文对三维建模软件中特征元素的分类和识别进行了研究。将建模样本按照长度进行分类,测试模板进入对应长度样本库进行语音识别。试验结果表明这种识别方法会降低总体正确率。于是本课题进行了样本库改进,使得语音识别效率大为提升。本文以三维建模软件界面中菜单项坐标作为其几何特征,通过数据通信,使语音识别结果与几何特征之间一一映射,以实现对建模软件的语音控制。最后,本课题搭建了一个语音自动几何建模原型系统,该原型系统的主要任务是完成对Pro/E软件的语音控制。本课题在分别完成录音软件开发、语音识别动态链接库调用、Pro/E软件的调用工作后,将各模块整合完成原型系统开发。该原型系统建立好后,经过试验分析以及对原型系统进行性能测试,本课题所开发的原型系统能实现对Pro/E的语音控制,本课题原型系统完成一次语音自动建模的时间在20秒至37秒之间不等。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
本文编号:2526554
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【参考文献】
相关期刊论文 前2条
1 杨丹;姜占才;余蓥良;李振起;;语音信号共振峰提取方法的研究分析[J];科技信息;2012年04期
2 唐涛;李敏;王君英;;CAD/CAM快速成型个性化桩核设计制作[J];清华大学学报(自然科学版);2013年02期
,本文编号:2526554
本文链接:https://www.wllwen.com/kejilunwen/wltx/2526554.html