武汉方言语音识别系统研究

发布时间：2017-08-23 14:22

本文关键词：武汉方言语音识别系统研究

【摘要】：语音识别自上世纪50年代兴起一直是研究的热点之一。我国研究语音识别技术较国外稍晚,自八十年代为其设立专项开始,到今天为止已经取得很多突破性的进展,但仍然有很多技术难关没有攻破,除了语音识别技术的复杂性,汉语方言的多样性也给其带来了诸多的挑战。当前,已经有一些科研人员将地方方言考虑到语音识别系统之中,但是由于这才处于开始阶段,仍然有很多关键性问题没有被解决。完整的连续语音识别系统主要包括四个部分:预处理,特征提取,声学模型和语言模型。预处理模块主要是对输入语音信号进行处理,原始语音信号通常受到噪音的干扰,以及声源缘故可能造成的信号较弱,通过预处理之后,语音信号在不失真的情况下能过滤掉大部分噪音,且使得原本较弱的信号得到加强。特征提取主要是提取语音信号中能够区别不同信号的特征参数,目前应用最为广泛的特征参数是Mel倒谱系数。声学模型通过训练语音库获取参数模型,识别阶段得到最佳参数流。语音模型的作用就是根据声学层的参数流预测某个自然语言出现的概率。本文根据着重讨论其中三部分:预处理中语音端点检测、基于HMM的声学模型和基于统计的语言模型。完成的主要工作如下:1)分析了武汉方言的发音特点,对比普通话的发音特性,标注出其差异性,提取其语音特征,创建小型的武汉方言语音识别语料库。2)利用小波重构语音信号,平滑处理背景噪音,改善语音端点检测在低信噪比情形下检测准确率低的缺点。3)提出一种基于重分形的语音端点检测方法。利用语音信号的分形特性,逐次求取分形维数,并计算其与语音段和非语音段的相关性,以此确定语音信号的端点。4)构建基于HTK的武汉方言语音识别系统,从不同维度提取武汉方言的不同特征参数进行语音识别实验。
【关键词】：武汉方言 语音识别 小波变换 重分形
【学位授予单位】：武汉工程大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.34
【目录】：

摘要5-6
ABSTRACT6-10
第1章绪论10-16
1.1 语音识别研究背景10-12
1.1.1 语音识别的发展历史与现状10-11
1.1.2 国内语音识别的发展历史与现状11-12
1.2 语音识别关键技术概述12-13
1.3 课题研究内容及意义13-16
1.3.1 研究意义13-14
1.3.2 论文结构安排14-16
第2章语音端点检测16-22
2.1 语音端点检测概述16
2.2 语音端点检测原理16-18
2.3 常用语音端点检测算法18-20
2.3.1 短时能量18
2.3.2 短时平均过零率18-19
2.3.3 基于短时能量和过零率的双门限检测方法19-20
2.4 本章小结20-22
第3章基于小波变换的重分形语音端点检测方法22-38
3.1 概述22-25
3.1.1 分形简介22-23
3.1.2 典型单重分形维数23-24
3.1.3 分形盒维数计算方法24-25
3.2 多重分形25-27
3.2.1 多重分形概述25-26
3.2.2 广义维数计算方法26-27
3.3 分形维数的信号度量能力27-29
3.4 小波去噪29-33
3.4.1 小波去噪原理29-30
3.4.2 合理选择分解与重构尺度30-33
3.5 重分形的语音端点检测技术33-38
3.5.1 多重分形端点检测基本原理33-34
3.5.2 重分形的相关性度量方法34
3.5.3 重分形的语音端点检测实现过程34-38
第4章基于HMM的声学模型38-48
4.1 HMM基本原理38-40
4.2 HMM的核心问题40-41
4.3 HMM基本算法41-46
4.3.1 向前-向后算法41-44
4.3.2 Viterbi算法44-45
4.3.3 Baum-Welch算法45-46
4.4 本章小结46-48
第5章语言模型48-56
5.1 语言模型的分类48-51
5.1.1 基于规则的语言模型48-49
5.1.2 基于统计的语言模型49-51
5.2 语言模型的平滑技术51-54
5.2.1 线性插值平滑52
5.2.2 Good-Turing平滑法52-53
5.2.3 Katz平滑技术53-54
5.3 语言模型的度量54-55
5.3.1 困惑度54-55
5.3.2 熵55
5.4 本章小结55-56
第6章基于HTK的武汉方言语音识别系统的构建56-64
6.1 HTK工作基本原理56-57
6.2 语音采集与语料库建立57-59
6.2.1 声学模型建模单元的选取57-58
6.2.2 武汉方言注音符号系统58
6.2.3 语料库建立58-59
6.3 特征提取59-60
6.4 语言模型的建立与训练60-63
6.5 声学模型训练63-64
第7章实验及数据分析64-70
7.1 实验样本64
7.2 实验评价标准64-66
7.3 实验方案设计与结果分析66-70
第8章总结与展望70-72
参考文献72-78
攻读硕士期间已发表的论文78-80
致谢80

【相似文献】

中国期刊全文数据库前10条

1 韩纪庆,王承发,吕成国,张磊,任为民,马永林;噪声环境下顽健的语音识别系统[J];电声技术;2002年01期

2 单翼翔,张昊天,李虎生,钟林,张进,刘加,刘润生;邮包校核语音识别系统的实时实现[J];电子学报;2002年04期

3 许海天,吴及,王作英;汉语连续数字串语音识别系统[J];计算机工程与应用;2002年02期

4 梁钊;分布式语音识别系统及其相关技术[J];计算机工程与应用;2002年12期

5 武剑虹,黄石磊,匡镜明;语音识别系统测试平台设计[J];电讯技术;2003年04期

6 孙恒,李春;嵌入式语音识别系统的研究[J];计算机与现代化;2003年06期

7 孟建庭,吴及,王作英;分布式语音识别系统的架构分析和具体实现[J];电声技术;2004年08期

8 郭罡,李锦宇,李小兵,刘波,王仁华;嵌入式命令词语音识别系统[J];信号处理;2004年05期

9 黄启良;汉语方言语音识别系统的构建[J];广西科学院学报;2005年03期

10 刘彬;董金明;;语音识别系统[J];电子测量技术;2005年06期

中国重要会议论文全文数据库前10条

1 王仁华;倪晋富;;语音识别系统评估初探[A];第二届全国人机语音通讯学术会议论文集[C];1992年

2 迟边进;方棣棠;;粗识别在大字表语音识别系统中的应用[A];第一届全国语言识别学术报告与展示会论文集[C];1990年

3 刘家松;刘承玺;李爱军;;对语音识别系统中一些环节的计算方法的选择[A];第一届全国语言识别学术报告与展示会论文集[C];1990年

4 秦勇;莫福源;李昌立;关定华;;汉语超大词汇语音识别系统的研究与实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年

5 幸璐璐;谢莎莎;王侠;孙甲松;王作英;;利用废料模型改进受限域语音识别系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年

6 胡春静;吴善培;;不定人的语音识别系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年

7 方敏;浦剑涛;李成荣;台宪青;;嵌入式语音识别系统的研究和实现[A];第七届全国人机语音通讯学术会议（NCMMSC7）论文集[C];2003年

8 高勤;吴昊;袁丽;吴玺宏;迟惠生;;语音识别系统实时优化方法研究及实现[A];第八届全国人机语音通讯学术会议论文集[C];2005年

9 孙甲松;肖熙;王作英;;利用有调拼音模型改进语音识别系统的稳健性[A];第七届全国人机语音通讯学术会议（NCMMSC7）论文集[C];2003年

10 陈立伟;赵春晖;;一种抗噪声语音识别系统的设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年

中国重要报纸全文数据库前10条

1 平远;多语种交谈式语音识别系统[N];北京电子报;2000年

2 张群英;IBM新中文语音识别系统动口不动手[N];中国计算机报;2000年

3 ;e-t@lk语音识别系统亮相中国[N];国际商报;2000年

4 北大企研中心研究部科强楚天一清;我惟一我存在[N];中国计算机报;2001年

5 ;集成信息技术提高物流精准度[N];现代物流报;2008年

6 吴德强;机器人出国当导游[N];北京科技报;2004年

7 本报记者操秀英;手机当道电脑让路？[N];科技日报;2007年

8 本报记者　齐芳　通讯员　发强;中科院声学所：探索声音的奥秘[N];光明日报;2004年

9 宋玉慧;“傻瓜家电”在沈走俏[N];中国电子报;2002年

10 特约撰稿人朱丽亚本报记者潘峰;黄学东人生路上总是快一步[N];中国高新技术产业导报;2003年

中国硕士学位论文全文数据库前10条

1 飞龙;蒙古语语音识别系统的研究与优化[D];内蒙古大学;2009年

2 王坤卿;小词汇量语音识别系统[D];中国石油大学;2010年

3 魏力;嵌入式语音识别系统的研究[D];武汉理工大学;2006年

4 肖翠萍;小波变换在语音识别系统的研究与实现[D];吉林大学;2004年

5 贺宽;车载多媒体语音识别系统设计[D];武汉理工大学;2008年

6 斯芸芸;嵌入式语音识别系统的设计与实现[D];重庆大学;2012年

7 高朝煌;非特定人汉语连续数字语音识别系统的研究与实现[D];西安电子科技大学;2011年

8 周艳萍;机器人嵌入式语音识别系统设计与开发[D];华南理工大学;2012年

9 庞陟儒;支持向量机语音识别系统的数据分析预选取算法研究[D];太原理工大学;2013年

10 叶亮亮;基于拼音音元的语音识别系统研究与设计[D];重庆大学;2013年

，

本文编号：725533

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/725533.html

上一篇：数字音频广播技术介绍
下一篇：改进S变换及其瞬时频率估计应用

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|