当前位置:主页 > 科技论文 > 信息工程论文 >

基于深度学习的客家方言语音识别

发布时间:2021-12-02 01:11
  近年来,由于大数据和云计算的高速发展,在人工智能浪潮的推动下,使用自然语言进行人机交互,这类自动语音识别一直是研究的热点。同时语音识别也是智能家居和智慧电商等市场的首要研究重点。虽然市场上的语音识别系统众多,但针对方言的语音识别及研究寥寥无几。在此背景之下,本文以客家方言语料库为语料,以神经网络作为模型结构,搭建一个基于深度神经网络的客家方言语音识别系统,对客家方言的语音识别研究具有实用价值。首先,本文介绍了深度学习相关的关键技术,包括神经网络、循环神经网络(Recurrent Neural Networks,RNN)、长短时记忆网络(Long Short Term Memory Network,LSTM)以及结构更为简单的门控循环单元网络(Gated Recurrent Unit,GRU)。然后,对语音识别系统的结构与技术进行分析,并着重介绍了语音信号的处理技术。其次,通过建设客家方言语料库,详细地介绍了语料库的建设过程,包括语料的选取、录制、整理与核音、语音标注;最后,基于TensorFlow的深度学习框架,选择了一款开源的语音识别工具,通过对客家方言的语音采集作为语料,结合当前先... 

【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:77 页

【学位级别】:硕士

【部分图文】:

基于深度学习的客家方言语音识别


深度学习人脸识别过程示意图

结构图,神经元模型,结构图


华南理工大学硕士学位论文经元模型,基于生物神经网络的神经元模型诞生[30]。它由心理学家 Warralter Pitts 提出。神经元是模仿生物的神经元设计的,树突、轴突体的输入、输出和接口,神经细胞的工作方式是兴奋与抑制,并硬权限函数)来模拟各种机制。单个神经元模型结构如图 2-2 所

激活函数,参数修正,损失函数


(a) sigmod 函数 (b) ReLU 函数图 2-3 两种激活函数ltilayer Perceptron)是一种单向多层的前馈神经网其结构如图 2-4 所示,包括一个输入层、一个步骤也就是前向传播(Forward Pass)过程。前然后经过激活函数处理。经过激活函数后的输定一个损失函数对差距大小计算误差,并根据传播和目标输出相对接近,这种参数修正的过

【参考文献】:
期刊论文
[1]语音识别大揭秘:计算机如何处理声音?[J]. 周弘烨.  中国新通信. 2019(04)
[2]基于深度学习和MFCC特征的脑卒中预测方法[J]. 陈鸥宇,刘怡俊,叶武剑,牟志伟,李琪.  信息与电脑(理论版). 2019(03)
[3]深度学习技术概述[J]. 张睿哲.  中国新通信. 2018(21)
[4]卷积神经网络算法在语音识别中的应用[J]. 张文宇,刘畅.  信息技术. 2018(10)
[5]语音识别技术概述[J]. 李志远.  中国新通信. 2018(17)
[6]基于动态BLSTM和CTC的濒危语言语音识别研究[J]. 于重重,陈运兵,孙沁瑶,刘畅,徐世璇,尹蔚彬.  计算机应用研究. 2019(11)
[7]深度学习研究综述[J]. 张荣,李伟平,莫同.  信息与控制. 2018(04)
[8]语音识别技术的研究进展与展望[J]. 王海坤,潘嘉,刘聪.  电信科学. 2018(02)
[9]ReLU激活函数优化研究[J]. 蒋昂波,王维维.  传感器与微系统. 2018(02)
[10]重庆方言语音识别系统的设计与实现[J]. 张策,韦鹏程,陆晓燕,石熙.  计算机测量与控制. 2018(01)

博士论文
[1]基于深度神经网络的语音识别模型研究[D]. 张仕良.中国科学技术大学 2017

硕士论文
[1]基于深度神经网络的蒙古语语音识别系统声学模型的研究[D]. 张红伟.内蒙古大学 2017
[2]基于深度关注神经网络的汉语方言辨识[D]. 邱远航.江苏师范大学 2017
[3]基于深度学习的藏语拉萨方言语音识别的研究[D]. 张宇聪.西北师范大学 2016



本文编号:3527422

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3527422.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e6439***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com