当前位置:主页 > 科技论文 > 信息工程论文 >

基于IAM的深度学习语音情感识别算法研究

发布时间:2023-03-05 20:29
  语音作为人与人沟通和情感传递的重要媒介,一直以来都是人工智能研究的重要方向。在传统的情感识别系统研究中,如何提取更具有判别性的情感相关特征一直是研究界备受关注的内容。目前,系统特征参数的选取具有一定的盲目性,系统操作复杂度和时间复杂度较高。尤其在一些复杂场景识别,比如:大规模语音数据集、情绪类别复杂的场景等,不能有效描述语音数据复杂的空间分布,对于语音的上下文信息利用也极其有限,传统的语音情感识别方法已经不能很好的解决以上问题。神经网络模型作为一种可以“自学习”的模型,被证明可以有效的解决特征提取分类的问题。本文针对传统语音情感特征学习方法的不足,以注意力机制原理为基础,提出了基于改进注意力机制(Improved Attention Mechanism,IAM)的深度学习情感识别优化算法,该算法主要提出了一种改进的注意力机制模型AItti(Attention Itti);然后,针对AItti模型全局特征丢失问题,提出了基于改进空间权重的深度学习情感识别优化算法,该算法以AItti模型为基础进一步提出了一种约束型空间权重网络(Constraint-Space-Weight Network...

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景与意义
    1.2 研究现状
        1.2.1 语音情感数据库
        1.2.2 情感特征参数
        1.2.3 语音情感识别模型
        1.2.4 语音情感识别主要难题
    1.3 主要内容及章节安排
第2章 语音情感识别及深度学习基础知识
    2.1 预处理
        2.1.1 端点检测
        2.1.2 预加重
        2.1.3 分帧、加窗
    2.2 传统情感特征参数
        2.2.1 短时过零率
        2.2.2 梅尔频率倒谱系数
    2.3 深度学习模型的语音特征提取
        2.3.1 神经网络模型
        2.3.2 反向传播算法
        2.3.3 循环神经网络和LSTM模型
        2.3.4 CNN模型
    2.4 分类器
    2.5 本章小结
第3章 基于AItti的深度学习语音情感识别优化算法
    3.1 引言
    3.2 基于AItti的深度学习语音情感识别优化算法
        3.2.1 语谱图提取
    3.3 AItti模型
    3.4 混合神经网络
        3.4.1 卷积层
        3.4.2 归一化层
        3.4.3 池化层
        3.4.4 BiLSTM层
        3.4.5 Softmax分类器
        3.4.6 有监督训练
        3.4.7 微调的CRNN模型
        3.4.8 微调优化
    3.5 算法性能与实验结果分析
        3.5.1 算法评估
        3.5.2 数据库
        3.5.3 实验设置
        3.5.4 实验结果与分析
    3.6 本章小结
第4章 基于CSWNet的深度学习语音情感识别优化算法
    4.1 引言
    4.2 挤压-激励网络(SENet)
    4.3 基于CSWNet的深度学习语音情感识别优化算法
    4.4 改进的空间权重网络
    4.5 微调的CRNN模型
    4.6 算法性能与实验分析
        4.6.1 实验设置
        4.6.2 实验结果与分析
    4.7 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
致谢
参考文献
附录



本文编号:3756866

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3756866.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3019b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com