基于希尔伯特空间的超球覆盖语音识别算法研究
本文关键词:基于希尔伯特空间的超球覆盖语音识别算法研究,由笔耕文化传播整理发布。
【摘要】:语音识别是语音链的一环,其最终目的是使计算机听懂任何人、任何内容的讲话。语音识别技术作为一门交叉学科,在家电产品、智能玩具、商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号等领域得到了非常广泛的应用。虽然语音识别技术已经取得了一些成就,但是由于语音信号的多样性和复杂性,目前的语音识别效率还有待提高,因而开发高效率语音识别模型和算法成为语音识别研究中的一个重要课题。本文分别对语音识别技术中的预处理、特征提取和模式识别进行了细致的研究,其主要内容有:为了研究语音识别与何种参数相关,本文做了相关的特征提取实验,将现有的时域特征、频域特征及时频域特征进行对比分析,发现时频域特征才是语音识别的特征关键,通过对时频谱的简化,得到了一个新的语音时频特征——过零谱,再经由大量实验证明,过零谱是一种可以实现简单且识别效率高的语音特征函数。针对现有的语音识别模型虽精确度高但是计算复杂的特点,提出了一种高识别率,低复杂度的语音识别模型——基于希尔伯特空间的超球覆盖识别算法,该算法不用做FFT。通过反复实验,可知该算法在算法复杂度上低于传统的语音识别算法,而在语音识别的准确率上不低于传统的语音识别算法。本文通过提出了一种新的特征提取方法,并用基于希尔伯特空间的超球覆盖识别算法进行识别,经在MATLAB上进行仿真,得到的结果表明该算法运行速度快,识别率高。本文的研究主要应用于低速率嵌入式系统中,当前语音识别算法相对较复杂,导致了语音芯片昂贵,今后将继续朝着语音识别实时、准确和语音识别系统价格低廉的方向努力,这样才能使语音识别更有应用价值,尤其是在物联网和智能家居上。
【关键词】:语音识别 特征提取 过零谱 希尔伯特空间 超球覆盖
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-13
- 1.1 语音识别技术概述8-9
- 1.2 语音识别的发展和现状9-11
- 1.2.1 国外发展历史及现状9-10
- 1.2.2 国内发展历史及现状10-11
- 1.3 课题研究背景及意义11-12
- 1.4 本文的创新点12
- 1.5 本文内容安排12-13
- 第二章 语音识别技术基本原理13-21
- 2.1 语音识别系统构成13-15
- 2.2 语音信号预处理15-19
- 2.2.1 语音信号的预加重处理15
- 2.2.2 语音信号的加窗分帧15-17
- 2.2.3 语音信号的端点检测17-19
- 2.3 语音识别特征提取19-20
- 2.4 模式识别算法20
- 2.5 本章小结20-21
- 第三章 特征参数过零谱的提取21-30
- 3.1 常用特征参数提取21-25
- 3.1.1 线性预测系数(LPC)21-22
- 3.1.2 线性预测倒谱系数(LPCC)22-23
- 3.1.3 Mel频率倒谱系数(MFCC)23-25
- 3.2 新的特征参数提取25-29
- 3.3 本章小结29-30
- 第四章 基于希尔伯特空间的超球覆盖算法30-48
- 4.1 常用识别算法30-38
- 4.1.1 动态时间规整(DTW)30-33
- 4.1.2 隐马尔可夫模型(HMM)33-38
- 4.2 算法基本思想38-40
- 4.3 算法具体实现40-46
- 4.3.1 模板训练过程40-45
- 4.3.2 匹配识别过程45-46
- 4.4 本章小结46-48
- 第五章 总结与展望48-50
- 5.1 总结48
- 5.2 展望48-50
- 参考文献50-53
- 攻读学位期间取得的研究成果53-54
- 致谢54
【相似文献】
中国期刊全文数据库 前10条
1 郭远琼;提高语音识别率点滴[J];电脑技术;2000年03期
2 邢文;语音识别[J];个人电脑;2000年02期
3 ;语音识别的真相[J];个人电脑;2001年12期
4 ;语音识别渐入佳境[J];个人电脑;2002年03期
5 ;微软语音识别软件可与人直接对话[J];自动化博览;2003年04期
6 ;语音识别[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;让语音识别软件 解放你的双手[J];农业图书情报学刊;2004年03期
8 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期
9 陈孝强;语音识别拟起新潮[J];微电脑世界;2005年07期
10 韩纪庆;张磊;郑铁然;;网络环境下的语音识别方法[J];计算机科学;2005年01期
中国重要会议论文全文数据库 前10条
1 张歆奕;吴今培;张其善;;语音的共性特征及其在语音识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
2 杜树木;何良华;;一种新的基于段长分布的语音识别模型[A];2009年通信理论与信号处理学术年会论文集[C];2009年
3 李桢;高万林;欧文浩;徐山川;;基于关键词语音识别的农业信息语音服务系统的研究与实现[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
4 张冰;龙长才;罗海风;;熟悉掩蔽音背景下的目标语音识别[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
5 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年
6 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议论文集[C];1992年
7 季宏;刘志文;杜燕玲;黄曾阳;;语音识别中的音字转换[A];第三届全国人机语音通讯学术会议论文集[C];1994年
8 葛余博;杨大利;曾德超;;噪声环境下语音识别的几个问题(一)[A];第三届全国人机语音通讯学术会议论文集[C];1994年
9 朱奇峰;俞铁城;;听觉中的协同现象和其对语音识别影响的探讨[A];第四届全国人机语音通讯学术会议论文集[C];1996年
10 姚磊;黄泰翼;陈景东;;一种高鲁棒性语音识别的通用自适应方法研究[A];第四届全国人机语音通讯学术会议论文集[C];1996年
中国重要报纸全文数据库 前10条
1 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
2 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
3 刘喜喜;语音识别将把鼠标键盘打入冷宫?[N];中国计算机报;2008年
4 乐天;语音识别:让你的手机更聪明[N];计算机世界;2011年
5 特约作者 王佳彬;语音识别渐入佳境[N];电脑报;2002年
6 雨夏;语音识别重在应用[N];计算机世界;2001年
7 ;语音识别企业应用前景光明[N];计算机世界;2003年
8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
9 上海 高博;让电脑“听懂”人话[N];电脑报;2008年
10 张彤;语音识别融入统一通信[N];网络世界;2008年
中国博士学位论文全文数据库 前10条
1 许金普;农产品市场信息采集的语音识别鲁棒性方法研究[D];中国农业科学院;2015年
2 包希日莫;面向蒙古语的语音识别声学建模研究[D];内蒙古大学;2016年
3 吴斌;语音识别中的后处理技术研究[D];北京邮电大学;2008年
4 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
5 孙f,
本文编号:456153
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/456153.html