基于BP神经网络的语音识别技术研究
发布时间:2017-10-24 14:00
本文关键词:基于BP神经网络的语音识别技术研究
【摘要】:语音识别技术应用前景广阔,因此得到了人们的较高关注。目前语音识别研究广泛应用动态时间规整(DTW)技术和隐马尔可夫模型(HMM)技术,已经取得了较为成熟的理论基础。由于语音不是一个简单的线性过程,而是复杂的非线性过程,近年来,研究人员将具有非线性、自适应、学习性等优点的人工神经网络应用到语音识别系统中,并取得了较好的效果。本文将以标准三层BP神经网络作为识别算法,探索了其在语音识别技术中的应用。 本文对孤立数字识别进行了系统的研究,采用了BP神经网络算法,对神经网络的结构和模型参数进行了实验研究,由此提高语音识别系统的识别率,最终实现了一个特定人孤立字的语音识别系统,为后续非特定人语音研究做铺垫。本文对语音识别的基本理论进行了详细的介绍。分析研究了语音信号预处理过程,包括语音信号采集、滤波、加窗、分帧以及端点检测等环节,同时还重点研究了LPCC和MFCC特征参数提取方法,并对MFCC特征参数提取进行了改进,提出了混合MFCC参数提取法,并对LPCC与MFCC的混合参数、LPCC和改进的MFCC相混合的参数进行了实验分析。对比了不同参数的识别性能,结果显示改进的MFCC参数和相混合的特征参数具有更好的识别性能。同时对BP神经网络的基本原理、学习规则以及算法流程进行了分析和介绍,提出了增加动量因子法与自适应速率方法相结合的算法,该算法同时解决了神经网络易陷入局部极小值点及收敛速度慢的缺点,极大的优化了系统性能。最后,对不同神经元个数和训练样本个数进行了仿真实验,得出了神经元个数和训练样本数目对识别的精度影响很大,实验中需选择合适的个数。
【关键词】:人工神经网络 语音识别 特征提取
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34;TP183
【目录】:
- 摘要3-4
- Abstract4-9
- 第一章 绪论9-15
- 1.1 引言9-10
- 1.2 国内外研究现状10-12
- 1.2.1 国外研究现状10-11
- 1.2.2 国内研究现状11-12
- 1.3 语音识别系统所面临的困难12-13
- 1.3.1 噪音干扰12
- 1.3.2 语音信号具有复杂和多变性12
- 1.3.3 鲁棒性方面12-13
- 1.3.4 语音系统的复杂性13
- 1.4 本文研究内容和结构安排13-15
- 1.4.1 研究内容13
- 1.4.2 结构安排13-15
- 第二章 语音识别基本原理和技术15-27
- 2.1 语音识别系统简介15-16
- 2.1.1 语音识别系统分类15
- 2.1.2 语音识别系统的基本原理15-16
- 2.2 语音信号预处理16-20
- 2.2.1 预滤波与采样16-17
- 2.2.2 预加重17
- 2.2.3 分帧加窗17-18
- 2.2.4 端点检测18-20
- 2.3 语音特征提取方法20-26
- 2.3.1 线性预测系数(LPC)21-22
- 2.3.2 线性预测倒谱系数(LPCC)22
- 2.3.3 美尔频率倒谱系数(MFCC)22-24
- 2.3.4 改进的混合MFCC24-26
- 2.4 本章小结26-27
- 第三章 人工神经网络相关理论及算法27-40
- 3.1 人工神经网络概述27-32
- 3.1.1 人工神经元28-29
- 3.1.2 人工神经网络模型29-30
- 3.1.3 神经网络的学习方法30-31
- 3.1.4 神经网络的学习规则31-32
- 3.2 BP神经网络32-36
- 3.2.1 BP神经网络结构32-34
- 3.2.2 BP网络的学习算法34-36
- 3.3 BP神经网络的不足与改进36-39
- 3.4 本章小结39-40
- 第四章 基于BP神经网络的语音识别仿真实现40-54
- 4.1 仿真系统的介绍40-41
- 4.2 语音样本的建立41-46
- 4.2.1 语音信号的采集41-42
- 4.2.2 语音信号预处理42-43
- 4.2.3 语音信号的特征参数提取43-44
- 4.2.4 特征参数的规整44-46
- 4.3 神经网络模型的建立46-47
- 4.4 神经网络的训练和识别47-48
- 4.5 仿真实验及性能分析48-53
- 4.5.1 BP神经网络改进前后性能比较48-49
- 4.5.2 网络结构对性能的影响49-51
- 4.5.3 不同参数的性能比较51-52
- 4.5.4 训练样本个数对识别性能的影响52
- 4.5.5 特定人和非特定人识别性能测试52-53
- 4.6 本章小结53-54
- 第五章 总结与展望54-56
- 5.1 全文总结54
- 5.2 前景展望54-56
- 参考文献56-59
- 致谢59
【参考文献】
中国期刊全文数据库 前10条
1 韩一;王国胤;杨勇;;基于MFCC的语音情感识别[J];重庆邮电大学学报(自然科学版);2008年05期
2 史笑兴,顾明亮,王太君,何振亚;一种时间规整算法在神经网络语音识别中的应用[J];东南大学学报;1999年05期
3 付丽辉;;语音识别关键性技术的MATLAB仿真实现[J];仪器仪表用户;2010年03期
4 李泽;崔宣;马雨廷;陈俊宇;;MFCC和LPCC特征参数在说话人识别中的研究[J];河南工程学院学报(自然科学版);2010年02期
5 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
6 吴尊敬,曹志刚;Improved MFCC-Based Feature for Robust Speaker Identification[J];Tsinghua Science and Technology;2005年02期
7 陈卫东;王晓亚;解静;;基于LPCC的多语种识别算法[J];无线电工程;2009年09期
8 张晓东,崔仁涛;文本文件的语音识别中音节的自动切分[J];皖西学院学报;2004年02期
9 熊伟;罗云贵;;语音识别的MFCC算法研究[J];现代商贸工业;2010年03期
10 张震宇;;基于Matlab的语音端点检测实验研究[J];浙江科技学院学报;2007年03期
,本文编号:1089041
本文链接:https://www.wllwen.com/kejilunwen/wltx/1089041.html