当前位置:主页 > 科技论文 > 信息工程论文 >

远距离混合语音识别方法的研究

发布时间:2017-03-18 19:05

  本文关键词:远距离混合语音识别方法的研究,由笔耕文化传播整理发布。


【摘要】:常规语音识别方法在无干扰噪声的安静环境下具有较高的识别率。然而,在实际封闭环境中存在着噪声和混响等干扰,且麦克风和语音源之间存在一定的距离时,传统识别方法性能急剧下降。此外,单一的语言已经满足不了现代人通信交流的需求。因此,远距离混合语音识别方法的研究成为机械学习与语音处理领域的研究热点。论文以麦克风阵列作为语音识别前端,利用阵列的空间选择性,开展了实际声学环境下远距离汉英混合语音识别方法的研究。论文详细分析了传统波束形成语音识别方法和优化阵列参数语音识别方法、论述了高斯混合隐马尔科夫模型(GMM-HMM,Gaussian Mixture Model-Hidden Markov Model)和深度神经网络(DNN-HMM,Deep Neural Network-Hidden Markov Model)混合声学模型,并对基于优化阵列参数的远距离混合语音识别方法进行了仿真实验研究。考虑到中英文发音特征及建模单元的不同,论文提出了一种中英文声学模型,构建了中英文决策树所需的问题集,得到了中英文混合语音声学模型参数,采用阵列优化参数实现了远距离混合语音识别,并基于HTK(The Hidden Markov Model Toolkit)工具箱构建了该语音识别系统。此外,论文采用了超帧的美尔倒谱系数(MFCC,Mel Frequency Cepstral Coefficients)作为特征参数,利用DNN-HMM方法进行声学建模,并基于Kaldi工具箱构建了大词汇量深度神经网络的混合语音识别系统。两种方法的仿真实验结果表明,后者DNN-HMM声学模型下的识别率高于前者GMM-HMM语音识别系统的识别率。
【关键词】:麦克风阵列 远距离语音识别 混合语音声学模型 优化阵列参数 深度神经网络
【学位授予单位】:辽宁工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
  • 摘要5-6
  • Abstract6-9
  • 1 绪论9-15
  • 1.1 选题背景及意义9
  • 1.2 语音识别技术发展的研究9-13
  • 1.2.1 单语种的语音识别的发展9-13
  • 1.2.2 多语种的语音识别的发展13
  • 1.3 论文的研究内容与安排13-15
  • 2 语音识别的基本理论15-27
  • 2.1 语音特征参数的提取15-17
  • 2.1.1 LPCC特征参数15-16
  • 2.1.2 MFCC系数16-17
  • 2.2 隐马尔科夫声学模型17-21
  • 2.2.1 HMM的基本思想17-18
  • 2.2.2 HMM的基本算法18-20
  • 2.2.3 HMM在语音识别中的应用20-21
  • 2.3 深度神经网络的基本原理21-25
  • 2.3.1 RBM的基本理论22-23
  • 2.3.2 RBM的训练过程23-24
  • 2.3.3 RBM构成DNN过程24-25
  • 2.4 语言模型25
  • 2.5 解码模型25-26
  • 2.6 本章小结26-27
  • 3 基于优化阵列参数的远距离语音识别方法27-36
  • 3.1 基于参数优化的阵列语音识别方法28-31
  • 3.1.1 滤波-求和波束形成28-29
  • 3.1.2 优化阵列参数的基本理论29-31
  • 3.2 优化阵列参数的具体步骤31-34
  • 3.2.1 优化状态序列31
  • 3.2.2 优化阵列参数31-34
  • 3.3 实验结果与分析34-35
  • 3.4 本章小结35-36
  • 4 优化决策树的远距离混合语音识别方法36-47
  • 4.1 中英文两种语言的区别36
  • 4.1.1 发音方面的区别36
  • 4.1.2 声学单元的选取36
  • 4.2 中英文声学建模的方法36-37
  • 4.3 三音子声学模型37-38
  • 4.4 基于决策树状态共享策略38-41
  • 4.4.1 问题集的设计38-40
  • 4.4.2 决策树的构造40-41
  • 4.5 实验结果与分析41-46
  • 4.5.1 仿真环境及配置41-42
  • 4.5.2 识别评价标准42
  • 4.5.3 实验结果与分析42-46
  • 4.6 本章小结46-47
  • 5 基于深度神经网络的语音识别方法47-54
  • 5.1 DNN-HMM建模的基本思想47
  • 5.2 Kaldi语音工具箱的简介47-50
  • 5.2.1 基于Kaldi具体实现DNN训练过程48-50
  • 5.3 实验结果与分析50-53
  • 5.3.1 数据集准备50
  • 5.3.2 预处理及网络参数配置50
  • 5.3.3 实验结果与分析50-53
  • 5.4 本章小结53-54
  • 6 总结和展望54-55
  • 参考文献55-58
  • 攻读硕士期间发表学术论文情况58-59
  • 致谢59

【相似文献】

中国期刊全文数据库 前10条

1 郭远琼;提高语音识别率点滴[J];电脑技术;2000年03期

2 邢文;语音识别[J];个人电脑;2000年02期

3 ;语音识别的真相[J];个人电脑;2001年12期

4 ;语音识别渐入佳境[J];个人电脑;2002年03期

5 ;微软语音识别软件可与人直接对话[J];自动化博览;2003年04期

6 ;语音识别[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;让语音识别软件 解放你的双手[J];农业图书情报学刊;2004年03期

8 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期

9 陈孝强;语音识别拟起新潮[J];微电脑世界;2005年07期

10 韩纪庆;张磊;郑铁然;;网络环境下的语音识别方法[J];计算机科学;2005年01期

中国重要会议论文全文数据库 前10条

1 张歆奕;吴今培;张其善;;语音的共性特征及其在语音识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

2 杜树木;何良华;;一种新的基于段长分布的语音识别模型[A];2009年通信理论与信号处理学术年会论文集[C];2009年

3 李桢;高万林;欧文浩;徐山川;;基于关键词语音识别的农业信息语音服务系统的研究与实现[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

4 张冰;龙长才;罗海风;;熟悉掩蔽音背景下的目标语音识别[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

5 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年

6 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议论文集[C];1992年

7 季宏;刘志文;杜燕玲;黄曾阳;;语音识别中的音字转换[A];第三届全国人机语音通讯学术会议论文集[C];1994年

8 葛余博;杨大利;曾德超;;噪声环境下语音识别的几个问题(一)[A];第三届全国人机语音通讯学术会议论文集[C];1994年

9 朱奇峰;俞铁城;;听觉中的协同现象和其对语音识别影响的探讨[A];第四届全国人机语音通讯学术会议论文集[C];1996年

10 姚磊;黄泰翼;陈景东;;一种高鲁棒性语音识别的通用自适应方法研究[A];第四届全国人机语音通讯学术会议论文集[C];1996年

中国重要报纸全文数据库 前10条

1 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年

2 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年

3 刘喜喜;语音识别将把鼠标键盘打入冷宫?[N];中国计算机报;2008年

4 乐天;语音识别:让你的手机更聪明[N];计算机世界;2011年

5 特约作者 王佳彬;语音识别渐入佳境[N];电脑报;2002年

6 雨夏;语音识别重在应用[N];计算机世界;2001年

7 ;语音识别企业应用前景光明[N];计算机世界;2003年

8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年

9 上海 高博;让电脑“听懂”人话[N];电脑报;2008年

10 张彤;语音识别融入统一通信[N];网络世界;2008年

中国博士学位论文全文数据库 前10条

1 许金普;农产品市场信息采集的语音识别鲁棒性方法研究[D];中国农业科学院;2015年

2 吴斌;语音识别中的后处理技术研究[D];北京邮电大学;2008年

3 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年

4 孙f,

本文编号:254881


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/254881.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c37d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com