当前位置:主页 > 科技论文 > 信息工程论文 >

基于循环神经网络的语音识别方案的优化与设计

发布时间:2018-05-09 18:59

  本文选题:语音识别 + 深度学习 ; 参考:《北京交通大学》2017年硕士论文


【摘要】:语音识别是人工智能的重要分支和一项重要的人机交互技术,被广泛的应用到各种生活场景中。当前的语音识别系统在纯净无噪的环境下的准确率已经超过了人的听觉,然而,真实应用场景中的复杂的环境因素对语音识别系统的准确度带来的影响,以及在开发阶段训练语音识别模型所消耗的时间成本与计算成本,成为阻碍语音识别发展的难题,因此,快速训练语音识别模型的同时提高识别率是语音识别的重要研究课题。本文主要研究如何在加快神经网络训练速度与解码速度的前提下提高语音识别模型的准确率。神经网络的黑盒性与不可解释性是改进神经网络结构的主要难题,本文使用可视化的方式,对神经网络的内部结构进行研究,基于可视化的结果分析了导致网络精度低与训练速度慢的主要原因。本文的研究工作主要由以下三个部分组成:第一部分,提出了一种基于跨层值传递的深度神经网络。深度神经网络的层数和参数的增加,可以有效的抑制过拟合的现象,而层数过深导致的直接问题是:信息在传递的过程中的损失。本文通过深度神经网络隐藏层的研究,提出了一种基于跨层值传递的神经网络,经验证该方法可以有效的防止信息在传递过程中的损失,提升神经网络的精度。第二部分,提出了一种二值化与线性表示结合的方法加速循环神经网络的训练与解码。循环神经网络内部复杂的结构是导致神经网络训练与解码速度慢的直接因素,本文基于对循环神经网络中的门的研究,提出了二值化与线性表示相结合的训练方法,经验证该方法可以做到在只损失少量精度的前提下加速神经网络的训练与解码。第三部分,将以上两种方式结合,提出了基于二值化与线性表示结合的跨层值传递深度循环神经网络结构,并设计了:常规测试,鲁棒性测试与速度测试三种方式对新的模型进行全面验证,最终结果表明:新的模型可以在加快训练速度与解码速度的前提下提升深度神经网络的精度。最后作者应用本文提出的新模型,实现了一个简单的在线语音识别系统,该系统可以并发的为用户提供大规模连续语音识别服务。
[Abstract]:Speech recognition is an important branch of artificial intelligence and an important human-computer interaction technology, which is widely used in various life scenes. The accuracy of the current speech recognition system in the pure noiseless environment has exceeded the human hearing rate. However, the complex environmental factors in the real application scene have an impact on the accuracy of the speech recognition system. And the time cost and computation cost of training speech recognition model in the development stage become a difficult problem that hinders the development of speech recognition. Therefore, fast training speech recognition model while improving the recognition rate is an important research topic of speech recognition. This paper mainly studies how to improve the accuracy of speech recognition model on the premise of speeding up the training speed and decoding speed of neural network. The black box and inexplicable nature of neural network are the main problems in improving the neural network structure. In this paper, the internal structure of neural network is studied by means of visualization. Based on the results of visualization, the main causes of low network precision and slow training speed are analyzed. The work of this paper is mainly composed of three parts: in the first part, a depth neural network based on cross-layer value transfer is proposed. The increase of layers and parameters of deep neural networks can effectively suppress the phenomenon of over-fitting, and the direct problem caused by the depth of layers is the loss of information in the process of transmission. Based on the research of the hidden layer of deep neural network, a neural network based on cross-layer value transfer is proposed in this paper. It is proved that this method can effectively prevent the loss of information in the transmission process and improve the accuracy of the neural network. In the second part, a method of combining binarization and linear representation is proposed to accelerate the training and decoding of cyclic neural networks. The complex structure of the cyclic neural network is the direct factor leading to the slow speed of training and decoding of the neural network. Based on the study of the gates in the cyclic neural network, a training method combining binarization and linear representation is proposed in this paper. It is proved that this method can speed up the training and decoding of neural networks with only a small loss of precision. In the third part, combining the above two methods, a cross-layer value transfer depth circulatory neural network structure based on binarization and linear representation is proposed, and a conventional test is designed. The results show that the new model can improve the precision of the depth neural network on the premise of accelerating the training speed and decoding speed. Finally, using the new model proposed in this paper, the author implements a simple online speech recognition system, which can simultaneously provide large-scale continuous speech recognition services for users.
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP183;TN912.34

【相似文献】

相关期刊论文 前10条

1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期

2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期

3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期

4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期

5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期

6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期

7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期

8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期

9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期

10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期

相关会议论文 前10条

1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年

2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年

3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年

9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年

10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年

8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年

9 ;神经网络和模糊逻辑[N];世界金属导报;2002年

10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年

相关博士学位论文 前10条

1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年

2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年

3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年

4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年

5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年

6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年

7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年

8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年

9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年

10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年

相关硕士学位论文 前10条

1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年

2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年

3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年

4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年

5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年

6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年

7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年

8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年

9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年

10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年



本文编号:1867037

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1867037.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ff1e2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com