汉语耳语音识别研究

发布时间：2017-08-17 09:31

本文关键词：汉语耳语音识别研究

【摘要】：汉语耳语音识别研究在国家安保、司法部门、金融领域、医疗系统以及人们日常交流中有着广泛的应用。目前汉语耳语音识别的研究在国内外依旧处于初级阶段,由于耳语音在声学特征方面的独特性,所以在其识别的研究过程中,还有许多问题亟待解决。本文以数字语音为实验对象,重点研究了汉语耳语音的声学特征,建立了一个基于隐马尔可夫模型的语音识别基线系统,比较了耳语音及正常音的特征距离和识别性能。根据比较结果,在MFCC的基础上改进了耳语音识别的特征参数,可以使集外识别率提升6.3%。通过实验比较指出了最适合耳语音识别的HMM状态数混合分量数分别为4和3。最后建立了一个汉语耳语音分类多级识别系统,提升了易混淆数字的辨识度。通过以上研究和改进,汉语数字耳语音(0-9)的集内识别率可以达到97.9%,集外识别率可以达到86.4%。
【关键词】：耳语音识别 隐马尔可夫模型 MFCC改进 分类多级识别系统
【学位授予单位】：苏州大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.34
【目录】：

中文摘要4-5
ABSTRACT5-8
第一章绪论8-14
1.1 耳语音研究的背景及意义8
1.2 耳语音识别的发展和研究现状8-10
1.2.1 语音识别的发展和现状8-9
1.2.2 耳语音识别的发展及现状9-10
1.3 耳语音识别难点分析10-11
1.4 本文的主要工作11-12
1.5 论文结构12-14
第二章耳语音声学特点14-20
2.1 耳语音的发音机理14-15
2.2 耳语音的声学特点15-20
2.2.1 耳语音产生的数学模型16-17
2.2.2 时域特征17
2.2.3 频域特征17-20
第三章耳语音识别基线系统20-31
3.1 语音识别系统概述20-21
3.2 隐马尔可夫模型的定义21-23
3.2.1 马尔可夫链21-22
3.2.2 隐马尔可夫模型22-23
3.3 隐马尔可夫模型的基本算法23-28
3.3.1 隐马尔可夫模型评价问题—前向后向算法23-25
3.3.2 隐马尔可夫模型解码问题— Viterbi算法25-26
3.3.3 隐马尔可夫模型训练问题—Baum-Welch算法26-28
3.4 基于HMM的汉语语音识别基线系统28-31
第四章基线系统下识别性能分析及改进31-48
4.1 实验准备31-34
4.1.1 语音库的建立31-33
4.1.2 特征参数的选取33-34
4.2 实验结果分析评价34-40
4.2.1 识别率分析评价34-36
4.2.2 特征距离分析36-40
4.3 特征参数分析及改进40-45
4.4 模型参数分析及选取45-48
第五章耳语音分类多级识别系统48-63
5.1 汉语数字语音识别的难点48-50
5.2 耳语易混淆数字原因分析50-55
5.2.1“2-[er]”和“8-[ba]”混淆50-53
5.2.2“6-[liu]”和“9-[jiu]”混淆53
5.2.3“1-[yi]”和“7-[qi]”混淆53-55
5.3 分类多级识别系统55-63
5.3.1 二级识别器A56-58
5.3.2 二级识别器B58-60
5.3.3 二级识别器C60-63
第六章总结与展望63-65
6.1 论文总结63-64
6.2 研究展望64-65
参考文献65-68
攻读硕士期间公开发表的论文68-69
致谢69-70

【参考文献】

中国期刊全文数据库前1条

1 顾良,刘润生;汉语数码语音识别:发展现状、难点分析与方法比较[J];电路与系统学报;1997年04期

，

本文编号：688280

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/688280.html

上一篇：基于Binary-LWE噪音控制优化的全同态加密方案与安全参数分析
下一篇：带干扰回避能力的光子学超宽带信号产生方法

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|