汉语耳语音识别研究
发布时间:2017-08-17 09:31
本文关键词:汉语耳语音识别研究
更多相关文章: 耳语音识别 隐马尔可夫模型 MFCC改进 分类多级识别系统
【摘要】:汉语耳语音识别研究在国家安保、司法部门、金融领域、医疗系统以及人们日常交流中有着广泛的应用。目前汉语耳语音识别的研究在国内外依旧处于初级阶段,由于耳语音在声学特征方面的独特性,所以在其识别的研究过程中,还有许多问题亟待解决。本文以数字语音为实验对象,重点研究了汉语耳语音的声学特征,建立了一个基于隐马尔可夫模型的语音识别基线系统,比较了耳语音及正常音的特征距离和识别性能。根据比较结果,在MFCC的基础上改进了耳语音识别的特征参数,可以使集外识别率提升6.3%。通过实验比较指出了最适合耳语音识别的HMM状态数混合分量数分别为4和3。最后建立了一个汉语耳语音分类多级识别系统,提升了易混淆数字的辨识度。通过以上研究和改进,汉语数字耳语音(0-9)的集内识别率可以达到97.9%,集外识别率可以达到86.4%。
【关键词】:耳语音识别 隐马尔可夫模型 MFCC改进 分类多级识别系统
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 中文摘要4-5
- ABSTRACT5-8
- 第一章 绪论8-14
- 1.1 耳语音研究的背景及意义8
- 1.2 耳语音识别的发展和研究现状8-10
- 1.2.1 语音识别的发展和现状8-9
- 1.2.2 耳语音识别的发展及现状9-10
- 1.3 耳语音识别难点分析10-11
- 1.4 本文的主要工作11-12
- 1.5 论文结构12-14
- 第二章 耳语音声学特点14-20
- 2.1 耳语音的发音机理14-15
- 2.2 耳语音的声学特点15-20
- 2.2.1 耳语音产生的数学模型16-17
- 2.2.2 时域特征17
- 2.2.3 频域特征17-20
- 第三章 耳语音识别基线系统20-31
- 3.1 语音识别系统概述20-21
- 3.2 隐马尔可夫模型的定义21-23
- 3.2.1 马尔可夫链21-22
- 3.2.2 隐马尔可夫模型22-23
- 3.3 隐马尔可夫模型的基本算法23-28
- 3.3.1 隐马尔可夫模型评价问题—前向后向算法23-25
- 3.3.2 隐马尔可夫模型解码问题— Viterbi算法25-26
- 3.3.3 隐马尔可夫模型训练问题—Baum-Welch算法26-28
- 3.4 基于HMM的汉语语音识别基线系统28-31
- 第四章 基线系统下识别性能分析及改进31-48
- 4.1 实验准备31-34
- 4.1.1 语音库的建立31-33
- 4.1.2 特征参数的选取33-34
- 4.2 实验结果分析评价34-40
- 4.2.1 识别率分析评价34-36
- 4.2.2 特征距离分析36-40
- 4.3 特征参数分析及改进40-45
- 4.4 模型参数分析及选取45-48
- 第五章 耳语音分类多级识别系统48-63
- 5.1 汉语数字语音识别的难点48-50
- 5.2 耳语易混淆数字原因分析50-55
- 5.2.1“2-[er]”和“8-[ba]”混淆50-53
- 5.2.2“6-[liu]”和“9-[jiu]”混淆53
- 5.2.3“1-[yi]”和“7-[qi]”混淆53-55
- 5.3 分类多级识别系统55-63
- 5.3.1 二级识别器A56-58
- 5.3.2 二级识别器B58-60
- 5.3.3 二级识别器C60-63
- 第六章 总结与展望63-65
- 6.1 论文总结63-64
- 6.2 研究展望64-65
- 参考文献65-68
- 攻读硕士期间公开发表的论文68-69
- 致谢69-70
【参考文献】
中国期刊全文数据库 前1条
1 顾良,刘润生;汉语数码语音识别:发展现状、难点分析与方法比较[J];电路与系统学报;1997年04期
,本文编号:688280
本文链接:https://www.wllwen.com/kejilunwen/wltx/688280.html