当前位置:主页 > 科技论文 > 信息工程论文 >

基于深度神经网络的语音识别研究

发布时间:2017-09-11 05:31

  本文关键词:基于深度神经网络的语音识别研究


  更多相关文章: 语音识别 深度学习(DL) Kaldi工具箱 音节错误率(WER)


【摘要】:在过去的几年里,以深度学习研究为基础发展起来的深度学习技术对信号和信息处理方面的工作有着越来越广泛的影响,可以说,深度学习已经拓宽为机器学习和人工智能研究的主要方面。 本文首先介绍了语音识别基于原理,主要介绍了语音信号的预处理过程,语音信号的MFCC特征和语音识别方法。 以人工神经网络在机器学习方面的应用为主线,,可以引入深层神经网络和深度学习问题。根据网络结构的作用和训练方法的不同,深层神经网络结构可以大致分为三类:生成深层结构,判别深层结构和混合深层结构。对于深度学习方法,本文主要介绍了BP算法和用RBM实现深度学习的方法。 最后,本文利用Kaldi语音识别工具箱,以BP训练算法为理论依据,对一个含有4隐层神经网络进行训练,并利用该网络进行中文语音识别。 本文以识别错误率为标准,研究了中文发音音子集对深层神经网络语音识别错误率的影响。
【关键词】:语音识别 深度学习(DL) Kaldi工具箱 音节错误率(WER)
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.34
【目录】:
  • 摘要3-4
  • Abstract4-5
  • 目录5-7
  • 第一章 绪论7-10
  • 1.1 研究背景7
  • 1.2 深度学习的几种定义7-8
  • 1.3 本文内容安排8-10
  • 第二章 语音识别基本原理10-19
  • 2.1 语音信号的预处理10-15
  • 2.1.1 语音信号的预加重11
  • 2.1.2 语音信号的加窗处理11-13
  • 2.1.3 语音信号的端点检测13-15
  • 2.2 语音识别特征提取15-16
  • 2.3 语音识别方法16-17
  • 2.4 本章小结17-19
  • 第三章 人工神经网络基础19-26
  • 3.1 人工神经元模型19-20
  • 3.2 神经网络应用于机器学习20-21
  • 3.3 BP 算法21-24
  • 3.4 神经网络的优化问题24-25
  • 3.5 本章小结25-26
  • 第四章 深度学习26-35
  • 4.1 深度学习结构26-30
  • 4.1.1 DNN 结构27-28
  • 4.1.2 DBN 结构28-30
  • 4.2 用 RBM 实现深度学习的方法30-34
  • 4.3 本章小结34-35
  • 第五章 Kaldi 语音识别系统35-40
  • 5.1 Kaldi 语音识别平台搭建35-37
  • 5.2 Kaldi 语音识别工具箱简介37-39
  • 5.3 本章小结39-40
  • 第六章 实验过程与结果分析40-51
  • 6.1 数据准备40-48
  • 6.1.1 data/local/dict 文件夹41-42
  • 6.1.2 data/train 文件夹42-44
  • 6.1.3 data/lang 文件夹44-47
  • 6.1.4 G.fst47-48
  • 6.2 主要的脚本文件48-49
  • 6.3 结果与分析49-50
  • 6.4 本章小结50-51
  • 参考文献51-55
  • 致谢55

【共引文献】

中国期刊全文数据库 前4条

1 刘翠;张歆奕;;基于FT和HHT的语音能量轮郭特征提取[J];五邑大学学报(自然科学版);2014年01期

2 孟泽民;林生生;;基于神经网络的家用型睡眠呼吸暂停综合症监测系统[J];计算机系统应用;2014年03期

3 张俏;杨骁;汤炜;;LPC与LSF系数转换的FPGA实现[J];微型机与应用;2014年13期

4 李野;姬红旭;张磊;张晓雪;;端点检测方法的研究[J];职业技术;2014年10期

中国硕士学位论文全文数据库 前10条

1 徐红梅;与文本无关的闭集声纹识别系统研究[D];哈尔滨理工大学;2013年

2 吴艳君;基于AMDF的脉搏周期提取算法改进[D];江西财经大学;2013年

3 罗影利;基于嵌入式的关键词组识别系统的设计与实现[D];南京理工大学;2014年

4 肖宇锋;基于ISOMAP语音特征提取的研究与DSP实现[D];湖南大学;2013年

5 王帅;基于压缩感知的语音信号压缩重构算法研究[D];中北大学;2014年

6 陈鸣;基于复倒谱变换的音频水印算法研究[D];长春理工大学;2013年

7 施巍巍;经验模态分解方法及其在语音识别算法中的研究[D];浙江理工大学;2014年

8 颜利君;基于噪声估计和掩蔽效应的语音增强[D];西南交通大学;2014年

9 庞永强;基于VoIP的VHF通信系统中话音质量增强方法研究[D];内蒙古大学;2014年

10 郭晓彬;基于DSP的G.729语音编码算法的研究与实现[D];吉林大学;2014年



本文编号:828916

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/828916.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7de2d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com