基于GA-ACO算法和BP神经网络的语音识别研究
发布时间:2017-12-16 03:01
本文关键词:基于GA-ACO算法和BP神经网络的语音识别研究
更多相关文章: 语音识别 BP神经网络 GA-ACO融合算法 辨认精度
【摘要】:语音作为人与人之间彼此交流最为重要的一种工具,在人工智能的组成中起到了极为重要的作用。随着计算机技术和通信技术的快速进步与发展,使它在各个行业中有着很好的前景,所以备受人们的重视,历来它都是根据线性理论来研究的,我们经常使用的方法就是动态时间规整技术(DTW)和隐马尔可夫模型(HMM)。当然,语音识别过程并不是一个简单的线性过程,其非线性使得利用线性理论来识别的方法的缺陷慢慢都展现出来了。近年来,人们对神经网络的研究越来越多,对其非线性理论更加了解了,把其用于语音识别中,能够得到更好的效果,因此,它也成为了如今研究的焦点。本文通过分析语音识别中的预处理、特征提取以及模式训练及匹配流程,发现最常用的方法有:预处理包括滤波采样、预加重、分帧加窗和端点检测。特征提取中阐述了线性预测系数(LPC)、线性预测倒谱系数(LPCC)和MEL频率倒谱系数(MFCC)三种基本方法。模式训练及匹配中阐述了动态时间规整算法(DTW)、隐马尔科夫模型(HMM)和神经网络模型(ANN)。本文主要就前馈神经网络(BP神经网络)的原理及其在语音识别的应用上进行了深入研究,针对该方法的不足之处,提出了将GA-ACO融合算法与其相结合,优化后的BP神经网络克服了传统BP神经网络收敛速度慢,存在局部极小值,动态性能不够理想,学习精度受一定的限制的不足,提出了一种新的方法来实现语音识别,而且在文中用此方法进行了MATLAB仿真实验,验证了其可行性。对于非指定人、单独数字的辨认,本文按照语音识别的基本方法,考虑到BP神经网络的缺点,用GA-ACO融合算法对其训练,形成了新的语音识别方法,并仿真了用新方法和传统BP神经网络方法进行语音识别的不同结果,而且讨论了不同特征参数、训练集、隐含层神经元个数对辨认精度的影响。研究结果表明,本文提出的基于GA-ACO融合算法的神经网络识别方法显示出其快速学习网络权值的能力,能够消除传统BP算法容易陷入局部极值和如何选取算法初始权重值来快速达到设定精度的困扰,从各个方面都能够比传统BP算法效果更好,有较高的辨认精确度,能够更好地投入到应用中。
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34;TP183
,
本文编号:1294408
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1294408.html