基于双向循环神经网络的汉语语音识别
发布时间:2024-03-22 04:15
当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。
【文章页数】:8 页
【文章目录】:
0 引言
1 循环神经网络结构
1.1 人工神经网络
1.2 单向循环神经网络
1.3 双向循环神经网络
2 汉语识别实验
2.1 实验设计
2.2 数据集描述
2.3 模型的构建
2.4 实验结果与分析
3 结论
本文编号:3934620
【文章页数】:8 页
【文章目录】:
0 引言
1 循环神经网络结构
1.1 人工神经网络
1.2 单向循环神经网络
1.3 双向循环神经网络
2 汉语识别实验
2.1 实验设计
2.2 数据集描述
2.3 模型的构建
2.4 实验结果与分析
3 结论
本文编号:3934620
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3934620.html