当前位置:主页 > 科技论文 > 信息工程论文 >

基于注意力机制的语音情感识别研究

发布时间:2024-05-22 02:26
  近年来,人工智能技术再一次在学术界掀起浪潮,越来越多的人工智能产品出现在大众的视野当中。语音是人类重要的表达方式,人工智能想要达到真正的智能,情感的识别是研究中不可或缺且格外重要的方向。语音情感识别技术是机器与人之间进行情感交互的桥梁,可以落地到医疗、安防、交通等诸多领域。目前学术界对于语音情感识别的研究主要采用的是深度学习的方法,本文基于情感的认知引入并聚焦注意力机制,研究构建适用于语音情感识别的深度学习网络,主要研究内容包括以下三个部分:1.研究了基于注意力机制的结构化情感信息提取语音情感信息是动态的,本文应用注意力机制在不同维度计算情感特征的注意力权重,实现对情感特征的多维度关注,提取情感结构化信息。具体本文从时间、频率、通道三个维度计算注意力,时间上应用单层及多层注意力对情感结构化信息进行全局和局部提取;频率及通道上分析计算注意力权重的不同方法并进行研究改进。本文最终通过应用注意力机制提取情感结构化信息,实现了 3.48%的UA准确率提升。2.提出了基于注意力的相对性情感信息提取方法语音情感是相对的,相对语音中情感外的信息是变化的,本文应用多任务学习和注意力机制引入情感相对信息...

【文章页数】:83 页

【学位级别】:硕士

【部分图文】:

图2.1语音情感识别系统框架

图2.1语音情感识别系统框架

天津师范大学硕士学位论文9第二章语音情感识别基本理论2.1语音情感识别系统框架一个典型的语音情感识别系统包括语音情感信息描述、语音情感语料库、语音情感特征提娶语音情感特征选择和语音情感分类识别等几个部分。系统整体框架流程如图2.1所示,语音信号采集模块通过传感器获得语音信号,对采....


图3.1基于不同类型注意力机制的语音情感识别模型

图3.1基于不同类型注意力机制的语音情感识别模型

天津师范大学硕士学位论文25图3.1基于不同类型注意力机制的语音情感识别模型在此过程之中,LocalAttention,ComponentAttention和MonotonicAttention,由于其包含其他注意力机制并未拥有的超参数Scope,所以这些注意力机制提前进行了Sc....


图3.2CNN结构下AttentionScope波动对比

图3.2CNN结构下AttentionScope波动对比

天津师范大学硕士学位论文25图3.1基于不同类型注意力机制的语音情感识别模型在此过程之中,LocalAttention,ComponentAttention和MonotonicAttention,由于其包含其他注意力机制并未拥有的超参数Scope,所以这些注意力机制提前进行了Sc....


图3.3BLSTM结构下AttentionScope波动对比

图3.3BLSTM结构下AttentionScope波动对比

天津师范大学硕士学位论文25图3.1基于不同类型注意力机制的语音情感识别模型在此过程之中,LocalAttention,ComponentAttention和MonotonicAttention,由于其包含其他注意力机制并未拥有的超参数Scope,所以这些注意力机制提前进行了Sc....



本文编号:3980260

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3980260.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8a1b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com