基于HMM-ANN模型的语音识别技术研究
本文关键词:基于HMM-ANN模型的语音识别技术研究
更多相关文章: 语音识别 HMM-ANN混合模型 端点检测 特征提取
【摘要】:在语音识别(ASR,Automatic Speech Recognition)领域中运用最广的隐马尔可夫模型(HMM,Hidden Markov Model)和人工神经网络(ANN,Artificial Neural Network)这两种模型各自均有优缺点。HMM有极强的动态建模能力,在处理具有动态性能的语音信号时有着很好的优势,却在分类功能上不足。ANN强大的输入输出映射能力使得它在处理模式分类与判决的问题上得天独厚,然而它对动态信号处理能力的不足也是不可忽视的。本文提出使用HMM-ANN混合模型来提高信号的处理能力,从而提高ASR系统的识别率。其中,ANN采用了概率神经网络学习算法。论文主要完成了以下工作:(1)总结ASR的研究现状和基本原理,比较HMM和ANN两种模型的优点和不足,提出HMM-ANN混合模型,并利用MATLAB软件分别仿真实现了HMM、ANN以及HMM-ANN这三种模型下的小词汇量、孤立汉语的语音识别功能。(2)比较了三种模型下语音识别的识别率,实验结果表明,混合模型的识别率最高。(3)对语音识别的鲁棒性进行了研究。一方面,端点检测时提出了改进后的检测算法。在用传统的双门限检测算法前,先用小波阈值去噪原理提高语音信号的信噪比,再进行检测。实验结果证明,在噪声环境下,改进后的算法表现出更好的抗噪性,即语音识别的鲁棒性更好,识别率更高。另一方面,特征提取时提出了改进后的提取算法。与传统的Mel频率倒谱系数(MFCC)相比,本文提出的基于近似估计非零项法原理的谱减法的SS-MFCC参数更能代表纯净语音的特征,且对应的语音识别率更高,即鲁棒性更好。
【关键词】:语音识别 HMM-ANN混合模型 端点检测 特征提取
【学位授予单位】:南昌航空大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要3-4
- ABSTRACT4-8
- 第1章 绪论8-15
- 1.1 引言8-9
- 1.2 研究背景与意义9-10
- 1.3 国内外研究现状10-13
- 1.4 主要研究内容13
- 1.5 论文组织结构13-15
- 第2章 语音识别的概述15-31
- 2.1 语音识别的基本原理15
- 2.2 语音信号的预处理15-23
- 2.2.1 数字化16-17
- 2.2.2 预加重17
- 2.2.3 分帧加窗17-19
- 2.2.4 端点检测19-23
- 2.3 语音信号的特征提取23-29
- 2.3.1 Mel频率倒普系数(MFCC)24-26
- 2.3.2 基于谱减法估计的改进算法26-29
- 2.4 模板训练与模板匹配29-30
- 2.5 本章小结30-31
- 第3章 HMM语音识别技术的研究31-39
- 3.1 HMM模型简介31
- 3.2 HMM的数学模型31-32
- 3.3 HMM模型的三个基本问题32-38
- 3.3.1 前向-后向算法33-35
- 3.3.2 Viterbi算法35-36
- 3.3.3 Baum-Welch算法36-38
- 3.4 本章小结38-39
- 第4章 ANN语音识别技术的研究39-46
- 4.1 ANN的概述39
- 4.2 ANN的基本组成要素39-42
- 4.2.1 神经元39-40
- 4.2.2 网络拓扑结构40-41
- 4.2.3 网络学习算法41-42
- 4.3 概率神经网络42-45
- 4.3.1 PNN概述42
- 4.3.2 PNN的识别过程42-45
- 4.4 本章小结45-46
- 第5章 HMM-ANN语音识别技术的研究46-51
- 5.1 HMM-ANN的结合依据46
- 5.2 HMM-ANN的结合方式46-47
- 5.3 HMM-ANN的语音识别过程47-50
- 5.4 本章小结50-51
- 第6章 仿真与实验分析51-73
- 6.1 准备工作51-53
- 6.2 预处理53-61
- 6.3 特征提取61-63
- 6.4 HMM-ANN混合模型的仿真63-72
- 6.4.1 HMM训练模型63-66
- 6.4.2 PNN训练模型66-67
- 6.4.3 实验结果与分析67-70
- 6.4.4 讨论70-72
- 6.5 本章小结72-73
- 第7章 总结与展望73-74
- 7.1 工作总结73
- 7.2 研究展望73-74
- 参考文献74-79
- 攻读硕士期间发表论文情况79-80
- 致谢80-81
【相似文献】
中国期刊全文数据库 前10条
1 ;飞利浦推出最新语音识别技术[J];现代通信;2000年08期
2 刘朝阳;语音识别技术的未来[J];互联网周刊;2000年07期
3 ;语音识别技术的产业化[J];金卡工程;2002年12期
4 刘云冰;;语音识别技术的回顾与展望[J];软件导刊;2005年13期
5 贺无名;;语音识别技术及其研究进展[J];中国科技信息;2006年18期
6 黄昆;;嵌入式,语音识别技术新趋向[J];中国计算机用户;2006年45期
7 高新涛;陈乖丽;;语音识别技术的发展现状及应用前景[J];甘肃科技纵横;2007年04期
8 任杰;;语音识别技术概述[J];大众科技;2010年08期
9 廖锎;;浅析语音识别技术的发展及趋势[J];科技传播;2010年17期
10 ;谷歌推出手机语音识别技术[J];电脑与电信;2010年08期
中国重要会议论文全文数据库 前10条
1 蔡伟建;;人工神经网络理论在语音识别技术中的应用[A];第八届全国信息获取与处理学术会议论文集[C];2010年
2 张化云;韩兆兵;徐波;;语音服务器中的语音识别技术[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年
3 方棣棠;李树青;;语音识别技术突破之路——如何使语音识别技术走向实用[A];第八届全国人机语音通讯学术会议论文集[C];2005年
4 贾磊;;深度神经网络建模的最新工业进展和结合语义理解的语音识别技术[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
5 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
6 蔡志博;俞铁城;;语音识别技术的应用[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
7 吕成国;赵冰;;低信噪比下语音识别技术的研究[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
8 魏峰;徐成;曾祺;;基于HMM的语音识别技术研究[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
9 黄媛;俞舸;吕士楠;;车载识别库的设计和制作[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
10 张茹;韩纪庆;;基于DTW算法的自动发音错误检测[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 陈琳;语音识别技术升级,人机对话时代来临[N];第一财经日报;2007年
2 京晨;中科院最新语音识别技术面世[N];福建科技报;2002年
3 IBM中国研究中心 沈丽琴博士;语音识别技术离我们有多远[N];光明日报;2000年
4 ;语音识别技术前景诱人[N];人民邮电;2001年
5 ;用语言“改变”世界[N];计算机世界;2001年
6 英国《经济学人》;有错请纠正:语音识别技术新进展[N];世界报;2010年
7 ;精彩演绎语音识别技术[N];人民邮电;2001年
8 记者 王双;我市参加第九届“高交会”收获成果[N];盘锦日报;2007年
9 记者 薛冬;中文语音识别技术取得突破[N];光明日报;2002年
10 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
中国博士学位论文全文数据库 前3条
1 王欢良;基于混淆网络和辅助信息的语音识别技术研究[D];哈尔滨工业大学;2007年
2 张军;抗噪声语音识别技术的研究[D];华南理工大学;2003年
3 董婧;鲁棒语音识别技术的研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 张朝阳;语音识别技术在盲用导航系统中的应用[D];北方工业大学;2011年
2 钱磊;外业调绘系统中的语音识别技术研究[D];长安大学;2015年
3 郑磊;鲁棒性连续语音识别的研究及其在Android平台的应用[D];电子科技大学;2014年
4 王琳;噪声环境下的鲁棒语音识别技术研究[D];哈尔滨工业大学;2016年
5 胡嘉林;基于语音识别技术的温室自动化控制系统研究[D];昆明理工大学;2015年
6 杨波;基于语音识别技术的白马语言保护研究[D];兰州大学;2016年
7 胡宝花;基于HMM-ANN模型的语音识别技术研究[D];南昌航空大学;2016年
8 罗云;语音识别技术在超声波系统中的应用[D];四川大学;2005年
9 洪祥元;基于语音识别技术的智能地球仪系统设计[D];北京交通大学;2012年
10 陈一宁;英语口语学习中的语音识别技术[D];上海交通大学;2010年
,本文编号:759802
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/759802.html