当前位置:主页 > 科技论文 > 信息工程论文 >

基于HMM和ANN混合模型的语音识别技术的研究

发布时间:2017-08-09 17:11

  本文关键词:基于HMM和ANN混合模型的语音识别技术的研究


  更多相关文章: 端点检测 隐马尔可夫 人工神经网络 高斯混合模型


【摘要】:近年来,在非特定人的连续词语音识别技术方面取得了很大进步,人工智能和机器学习已经成为一个非常热门的研究领域。语音识别虽然在理论上的研究已经取得了比较大的进展,但是在实际应用中仍然有很多难点。其中主要包括:第一,在实际应用开发过程中,语音训练样本数量往往比较有限,这将导致模型的参数训练不够充分,从而影响语音识别率。第二,由于环境中往往存在各种噪声,而噪声会对识别结果造成比较大的影响。本文针对以上难点提出了相应的解决方案。针对第一个难点引入了子空间高斯混合模型(SGMM),针对第二个难点引入了隐马尔可夫(HMM)和人工神经网络(ANN)的混合模型。论文的主要研究内容包括如下:(1)论文介绍了语音识别的基本技术原理,主要包括预加重、加窗分帧和端点检测。针对传统双门限端点检测算法在噪声环境下检测的不足,本文提出了改进的端点检测算法,端点检测的准确率得到了约7%的提高。(2)论文介绍了特征提取中的线性预测系数(LPC)、线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC)。对LPCC和MFCC做了对比分析,选择了更符合人耳听觉特性的MFCC作为语音识别的特征提取参数。(3)在语音识别的实际应用中,针对语音训练样本数据比较有限导致模型参数训练不够充分的情况,本文引入了SGMM模型,并对HMM+SGMM模型的原理进行了详细的介绍和分析。(4)论文首先针对不同数据量的训练样本对HMM模型和HMM+SGMM模型分别进行了测试,然后对HMM+SGMM模型在噪声环境下进行了测试。实验结果表明:在语音训练样本有限的情况下,引入子空间高斯混合模型是一种有效的模型优化手段;在噪声环境下HMM+SGMM模型仍然具有较好的识别效果;改进的端点检测算法对HMM+SGMM模型仍然适用。(5)针对HMM通常只在无噪声语音环境下具有比较好的识别效果,噪声环境下的语音识别率却较低。论文引入了HMM+ANN混合模型,并对HMM和HMM+ANN模型在信噪比为5-35dB的环境下做了实验测试,结果表明HMM+ANN模型的识别率明显高于HMM模型的识别率。论文也对改进的端点检测算法也做了测试,改进算法在噪声环境下对两种模型的识别率都有一定改善。
【关键词】:端点检测 隐马尔可夫 人工神经网络 高斯混合模型
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
  • 摘要5-6
  • ABSTRACT6-10
  • 第一章 绪论10-14
  • 1.1 语音识别介绍10
  • 1.2 课题研究的背景和意义10
  • 1.3 语音识别研究与应用现状10-12
  • 1.4 本文的主要研究内容12-13
  • 1.5 论文结构安排13-14
  • 第二章 语音识别技术的基本原理分析14-35
  • 2.1 语音信号的预处理14-18
  • 2.1.1 语音信号的数字化14-15
  • 2.1.2 语音信号预加重15-17
  • 2.1.3 语音信号加窗分帧17-18
  • 2.2 传统的端点检测算法及其改进18-24
  • 2.3 改进端点检测算法实验及结果分析24-29
  • 2.4 特征提取分析29-34
  • 2.5 本章小结34-35
  • 第三章 子空间高斯混合模型的研究与分析35-46
  • 3.1 隐马尔可夫模型35-38
  • 3.1.1 隐马尔可夫模型的介绍35
  • 3.1.2 隐马尔可夫模型的关键问题35-38
  • 3.1.2.1 前向算法(评估问题)36
  • 3.1.2.2 Viterbi算法(解码问题)36-37
  • 3.1.2.3 Baum-welch算法(训练问题)37-38
  • 3.2 隐马尔可夫模型的不足38-39
  • 3.3 子空间高斯混合模型39-41
  • 3.3.1 基本模型39-40
  • 3.3.2 模型扩展40-41
  • 3.3.3 通用背景模型41
  • 3.4 训练步骤41-44
  • 3.4.1 UBM初始化及训练42-43
  • 3.4.2 特征参数变换43
  • 3.4.3 子空间模型初始化43-44
  • 3.5 概率计算44
  • 3.5.1 全局优先计算44
  • 3.5.2 高斯概率计算44
  • 3.6 模型完整训练44-45
  • 3.7 本章小结45-46
  • 第四章 中文子空间高斯混合模型语音识别系统的研究与实现46-63
  • 4.1 Kaldi语音识别系统46-47
  • 4.2 Kaldi数据准备47-51
  • 4.3 语言模型51-52
  • 4.4 模型训练52-54
  • 4.5 实验及结果分析54-62
  • 4.6 本章小结62-63
  • 第五章 HMM和改进的ANN混合模型语音识别的研究与实现63-77
  • 5.1 人工神经网络63-69
  • 5.1.1 BP神经网络及其学习算法63-66
  • 5.1.2 受限玻尔兹曼网络RBM及其学习算法66-68
  • 5.1.3 改进的神经网络模型68-69
  • 5.2 基于HMM-ANN混合模型的语音识别系统69-76
  • 5.2.1 实验及结果分析69-76
  • 5.3 本章小结76-77
  • 第六章 总结与展望77-79
  • 6.1 全文总结77-78
  • 6.2 展望78-79
  • 致谢79-80
  • 参考文献80-83
  • 攻读硕士学位期间取得的成果83-84

【相似文献】

中国期刊全文数据库 前10条

1 ;飞利浦推出最新语音识别技术[J];现代通信;2000年08期

2 刘朝阳;语音识别技术的未来[J];互联网周刊;2000年07期

3 ;语音识别技术的产业化[J];金卡工程;2002年12期

4 刘云冰;;语音识别技术的回顾与展望[J];软件导刊;2005年13期

5 贺无名;;语音识别技术及其研究进展[J];中国科技信息;2006年18期

6 黄昆;;嵌入式,语音识别技术新趋向[J];中国计算机用户;2006年45期

7 高新涛;陈乖丽;;语音识别技术的发展现状及应用前景[J];甘肃科技纵横;2007年04期

8 任杰;;语音识别技术概述[J];大众科技;2010年08期

9 廖锎;;浅析语音识别技术的发展及趋势[J];科技传播;2010年17期

10 ;谷歌推出手机语音识别技术[J];电脑与电信;2010年08期

中国重要会议论文全文数据库 前10条

1 蔡伟建;;人工神经网络理论在语音识别技术中的应用[A];第八届全国信息获取与处理学术会议论文集[C];2010年

2 张化云;韩兆兵;徐波;;语音服务器中的语音识别技术[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年

3 方棣棠;李树青;;语音识别技术突破之路——如何使语音识别技术走向实用[A];第八届全国人机语音通讯学术会议论文集[C];2005年

4 贾磊;;深度神经网络建模的最新工业进展和结合语义理解的语音识别技术[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

5 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年

6 蔡志博;俞铁城;;语音识别技术的应用[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

7 吕成国;赵冰;;低信噪比下语音识别技术的研究[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年

8 魏峰;徐成;曾祺;;基于HMM的语音识别技术研究[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年

9 黄媛;俞舸;吕士楠;;车载识别库的设计和制作[A];中国声学学会2006年全国声学学术会议论文集[C];2006年

10 张茹;韩纪庆;;基于DTW算法的自动发音错误检测[A];第八届全国人机语音通讯学术会议论文集[C];2005年

中国重要报纸全文数据库 前10条

1 陈琳;语音识别技术升级,人机对话时代来临[N];第一财经日报;2007年

2 京晨;中科院最新语音识别技术面世[N];福建科技报;2002年

3 IBM中国研究中心 沈丽琴博士;语音识别技术离我们有多远[N];光明日报;2000年

4 ;语音识别技术前景诱人[N];人民邮电;2001年

5 ;用语言“改变”世界[N];计算机世界;2001年

6 英国《经济学人》;有错请纠正:语音识别技术新进展[N];世界报;2010年

7 ;精彩演绎语音识别技术[N];人民邮电;2001年

8 记者 王双;我市参加第九届“高交会”收获成果[N];盘锦日报;2007年

9 记者 薛冬;中文语音识别技术取得突破[N];光明日报;2002年

10 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年

中国博士学位论文全文数据库 前3条

1 王欢良;基于混淆网络和辅助信息的语音识别技术研究[D];哈尔滨工业大学;2007年

2 张军;抗噪声语音识别技术的研究[D];华南理工大学;2003年

3 董婧;鲁棒语音识别技术的研究[D];吉林大学;2007年

中国硕士学位论文全文数据库 前10条

1 张朝阳;语音识别技术在盲用导航系统中的应用[D];北方工业大学;2011年

2 杨波;基于语音识别技术的白马语言保护研究[D];兰州大学;2016年

3 胡宝花;基于HMM-ANN模型的语音识别技术研究[D];南昌航空大学;2016年

4 蒋玉博;基于HMM和ANN混合模型的语音识别技术的研究[D];电子科技大学;2016年

5 罗云;语音识别技术在超声波系统中的应用[D];四川大学;2005年

6 洪祥元;基于语音识别技术的智能地球仪系统设计[D];北京交通大学;2012年

7 陈一宁;英语口语学习中的语音识别技术[D];上海交通大学;2010年

8 李晨;结合语音识别技术的音乐哼唱检索研究[D];西北大学;2008年

9 胡嘉林;基于语音识别技术的温室自动化控制系统研究[D];昆明理工大学;2015年

10 燕涛;基于嵌入式语音识别技术的研究[D];大庆石油学院;2009年



本文编号:646388

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/646388.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e88c8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com