基于改进LSTM的儿童语音情感识别模型
发布时间:2022-12-08 02:20
为实现不同儿童情感需求状态下帧级语音特征的有效获取,建立一种基于改进长短时记忆(LSTM)网络的儿童语音情感识别模型。采用帧级语音特征代替传统统计特征以保留原始语音中的时序关系,通过引入注意力机制将传统遗忘门和输入门转换为注意力门,并根据自定义的深度策略计算得到深度注意力门,从而提高语音情感识别性能。实验结果表明,在Fau Aibo儿童情感数据语料库及婴儿哭声情感需求数据库上,该模型在召回率和F1分数上相比基于传统LSTM的识别模型分别提高了3.14%、5.50%和1.84%、5.49%,在CASIA中文情感数据库上,其相比基于传统LSTM和GRU的识别模型训练时间更短、儿童语音情感识别率更高。
【文章页数】:10 页
【文章目录】:
0 概述
1 相关工作
1.1 LSTM网络
1.2 注意力机制
2 改进的深度注意力门
2.1 注意力门
2.2 深度注意力门
2.3 训练整体框架
3 实验设置与分析
3.1 实验设置
3.2 帧级特征的选择
3.3 实验参数设置
4 算法性能分析
4.1 深度的性能分析
4.2 注意力门的时间和性能分析
5 结束语
【参考文献】:
期刊论文
[1]基于注意力CNLSTM模型的新闻文本分类[J]. 刘月,翟东海,任庆宁. 计算机工程. 2019(07)
[2]情感语音数据库综述[J]. 韩文静,李海峰. 智能计算机与应用. 2013(01)
[3]儿童情绪调节的发展研究[J]. 陆芳,陈国鹏. 心理科学. 2003(05)
硕士论文
[1]基于表情和语音双模态的儿童情感识别研究[D]. 戴惟嘉.东南大学 2016
本文编号:3713346
【文章页数】:10 页
【文章目录】:
0 概述
1 相关工作
1.1 LSTM网络
1.2 注意力机制
2 改进的深度注意力门
2.1 注意力门
2.2 深度注意力门
2.3 训练整体框架
3 实验设置与分析
3.1 实验设置
3.2 帧级特征的选择
3.3 实验参数设置
4 算法性能分析
4.1 深度的性能分析
4.2 注意力门的时间和性能分析
5 结束语
【参考文献】:
期刊论文
[1]基于注意力CNLSTM模型的新闻文本分类[J]. 刘月,翟东海,任庆宁. 计算机工程. 2019(07)
[2]情感语音数据库综述[J]. 韩文静,李海峰. 智能计算机与应用. 2013(01)
[3]儿童情绪调节的发展研究[J]. 陆芳,陈国鹏. 心理科学. 2003(05)
硕士论文
[1]基于表情和语音双模态的儿童情感识别研究[D]. 戴惟嘉.东南大学 2016
本文编号:3713346
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3713346.html