当前位置:主页 > 科技论文 > 网络通信论文 >

汉语耳语音识别研究

发布时间:2017-08-17 09:31

  本文关键词:汉语耳语音识别研究


  更多相关文章: 耳语音识别 隐马尔可夫模型 MFCC改进 分类多级识别系统


【摘要】:汉语耳语音识别研究在国家安保、司法部门、金融领域、医疗系统以及人们日常交流中有着广泛的应用。目前汉语耳语音识别的研究在国内外依旧处于初级阶段,由于耳语音在声学特征方面的独特性,所以在其识别的研究过程中,还有许多问题亟待解决。本文以数字语音为实验对象,重点研究了汉语耳语音的声学特征,建立了一个基于隐马尔可夫模型的语音识别基线系统,比较了耳语音及正常音的特征距离和识别性能。根据比较结果,在MFCC的基础上改进了耳语音识别的特征参数,可以使集外识别率提升6.3%。通过实验比较指出了最适合耳语音识别的HMM状态数混合分量数分别为4和3。最后建立了一个汉语耳语音分类多级识别系统,提升了易混淆数字的辨识度。通过以上研究和改进,汉语数字耳语音(0-9)的集内识别率可以达到97.9%,集外识别率可以达到86.4%。
【关键词】:耳语音识别 隐马尔可夫模型 MFCC改进 分类多级识别系统
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
  • 中文摘要4-5
  • ABSTRACT5-8
  • 第一章 绪论8-14
  • 1.1 耳语音研究的背景及意义8
  • 1.2 耳语音识别的发展和研究现状8-10
  • 1.2.1 语音识别的发展和现状8-9
  • 1.2.2 耳语音识别的发展及现状9-10
  • 1.3 耳语音识别难点分析10-11
  • 1.4 本文的主要工作11-12
  • 1.5 论文结构12-14
  • 第二章 耳语音声学特点14-20
  • 2.1 耳语音的发音机理14-15
  • 2.2 耳语音的声学特点15-20
  • 2.2.1 耳语音产生的数学模型16-17
  • 2.2.2 时域特征17
  • 2.2.3 频域特征17-20
  • 第三章 耳语音识别基线系统20-31
  • 3.1 语音识别系统概述20-21
  • 3.2 隐马尔可夫模型的定义21-23
  • 3.2.1 马尔可夫链21-22
  • 3.2.2 隐马尔可夫模型22-23
  • 3.3 隐马尔可夫模型的基本算法23-28
  • 3.3.1 隐马尔可夫模型评价问题—前向后向算法23-25
  • 3.3.2 隐马尔可夫模型解码问题— Viterbi算法25-26
  • 3.3.3 隐马尔可夫模型训练问题—Baum-Welch算法26-28
  • 3.4 基于HMM的汉语语音识别基线系统28-31
  • 第四章 基线系统下识别性能分析及改进31-48
  • 4.1 实验准备31-34
  • 4.1.1 语音库的建立31-33
  • 4.1.2 特征参数的选取33-34
  • 4.2 实验结果分析评价34-40
  • 4.2.1 识别率分析评价34-36
  • 4.2.2 特征距离分析36-40
  • 4.3 特征参数分析及改进40-45
  • 4.4 模型参数分析及选取45-48
  • 第五章 耳语音分类多级识别系统48-63
  • 5.1 汉语数字语音识别的难点48-50
  • 5.2 耳语易混淆数字原因分析50-55
  • 5.2.1“2-[er]”和“8-[ba]”混淆50-53
  • 5.2.2“6-[liu]”和“9-[jiu]”混淆53
  • 5.2.3“1-[yi]”和“7-[qi]”混淆53-55
  • 5.3 分类多级识别系统55-63
  • 5.3.1 二级识别器A56-58
  • 5.3.2 二级识别器B58-60
  • 5.3.3 二级识别器C60-63
  • 第六章 总结与展望63-65
  • 6.1 论文总结63-64
  • 6.2 研究展望64-65
  • 参考文献65-68
  • 攻读硕士期间公开发表的论文68-69
  • 致谢69-70

【参考文献】

中国期刊全文数据库 前1条

1 顾良,刘润生;汉语数码语音识别:发展现状、难点分析与方法比较[J];电路与系统学报;1997年04期



本文编号:688280

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/688280.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cf748***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com