基于深度学习的客家方言语音识别

发布时间：2021-12-02 01:11

　　近年来,由于大数据和云计算的高速发展,在人工智能浪潮的推动下,使用自然语言进行人机交互,这类自动语音识别一直是研究的热点。同时语音识别也是智能家居和智慧电商等市场的首要研究重点。虽然市场上的语音识别系统众多,但针对方言的语音识别及研究寥寥无几。在此背景之下,本文以客家方言语料库为语料,以神经网络作为模型结构,搭建一个基于深度神经网络的客家方言语音识别系统,对客家方言的语音识别研究具有实用价值。首先,本文介绍了深度学习相关的关键技术,包括神经网络、循环神经网络（Recurrent Neural Networks,RNN）、长短时记忆网络（Long Short Term Memory Network,LSTM）以及结构更为简单的门控循环单元网络（Gated Recurrent Unit,GRU）。然后,对语音识别系统的结构与技术进行分析,并着重介绍了语音信号的处理技术。其次,通过建设客家方言语料库,详细地介绍了语料库的建设过程,包括语料的选取、录制、整理与核音、语音标注;最后,基于TensorFlow的深度学习框架,选择了一款开源的语音识别工具,通过对客家方言的语音采集作为语料,结合当前先...

【文章来源】：华南理工大学广东省 211工程院校 985工程院校教育部直属院校

【文章页数】：77 页

【学位级别】：硕士

【部分图文】：

基于深度学习的客家方言语音识别

深度学习人脸识别过程示意图

结构图,神经元模型,结构图

华南理工大学硕士学位论文经元模型，基于生物神经网络的神经元模型诞生[30]。它由心理学家 Warralter Pitts 提出。神经元是模仿生物的神经元设计的，树突、轴突体的输入、输出和接口，神经细胞的工作方式是兴奋与抑制，并硬权限函数）来模拟各种机制。单个神经元模型结构如图 2-2 所

激活函数,参数修正,损失函数

(a) sigmod 函数 (b) ReLU 函数图 2-3 两种激活函数ltilayer Perceptron）是一种单向多层的前馈神经网其结构如图 2-4 所示，包括一个输入层、一个步骤也就是前向传播（Forward Pass）过程。前然后经过激活函数处理。经过激活函数后的输定一个损失函数对差距大小计算误差，并根据传播和目标输出相对接近，这种参数修正的过

【参考文献】：
期刊论文
[1]语音识别大揭秘:计算机如何处理声音?[J]. 周弘烨.  中国新通信. 2019(04)
[2]基于深度学习和MFCC特征的脑卒中预测方法[J]. 陈鸥宇,刘怡俊,叶武剑,牟志伟,李琪.  信息与电脑(理论版). 2019(03)
[3]深度学习技术概述[J]. 张睿哲.  中国新通信. 2018(21)
[4]卷积神经网络算法在语音识别中的应用[J]. 张文宇,刘畅.  信息技术. 2018(10)
[5]语音识别技术概述[J]. 李志远.  中国新通信. 2018(17)
[6]基于动态BLSTM和CTC的濒危语言语音识别研究[J]. 于重重,陈运兵,孙沁瑶,刘畅,徐世璇,尹蔚彬.  计算机应用研究. 2019(11)
[7]深度学习研究综述[J]. 张荣,李伟平,莫同.  信息与控制. 2018(04)
[8]语音识别技术的研究进展与展望[J]. 王海坤,潘嘉,刘聪.  电信科学. 2018(02)
[9]ReLU激活函数优化研究[J]. 蒋昂波,王维维.  传感器与微系统. 2018(02)
[10]重庆方言语音识别系统的设计与实现[J]. 张策,韦鹏程,陆晓燕,石熙.  计算机测量与控制. 2018(01)

博士论文
[1]基于深度神经网络的语音识别模型研究[D]. 张仕良.中国科学技术大学 2017

硕士论文
[1]基于深度神经网络的蒙古语语音识别系统声学模型的研究[D]. 张红伟.内蒙古大学 2017
[2]基于深度关注神经网络的汉语方言辨识[D]. 邱远航.江苏师范大学 2017
[3]基于深度学习的藏语拉萨方言语音识别的研究[D]. 张宇聪.西北师范大学 2016

本文编号：3527422

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3527422.html

上一篇：Graphene/TMDC异质结光导型器件制备与性能研究
下一篇：基于MIPS的MCU便携式十二导联心电采集系统的设计与实现

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|