面向语音情感识别的有效组合特征的分析与模型验证
发布时间:2024-05-11 06:13
近年来,人机交互领域,特别是在智能语音助手方面(如Siri,Cortana,Google Assistant)取得了巨大的进步,但我们仍然难以自然地与机器通信。语音情感识别正逐步成为人机交互领域的最新趋势之一。一般认为语音情感在人机交互中不可或缺,因为它给出了语境信息,体现了说话人的意图,有助于机器更好地理解人类的语音。然而,我们还不清楚哪种语音特征能够更有效地表征语音的情感,这也是语音情感识别在技术上的挑战性问题。本研究的目的是为了探索有效的语音特征以便进一步提升语音情感识别准确率。传统的语音情感识别是使用具有经验性的语音感知特征来区分情绪。近年来,卷积神经网络(CNN)在从原始语谱图挖掘深度信息方面表现出了强大优势,但是基于感知特征的先验知识没有像传统方法那样被充分利用。为了解决这个问题,我们提出了一种新颖的特征组合策略,即同时利用综合语谱信息和先验知识。首先,我们将基于先验知识的低级声学特征(LLDs)按时间排列为时间序列LLDs,以便CNN进行的有效学习。接下来,将时间序列LLDs和原始语谱图融合为组合语谱特征(CSF)。为了进一步增加全局和动态信息,在CSF上添加了统计特征生...
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
本文编号:3969642
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图2-1语音情感识别的一般流程
第2章语音情感识别方法与特征提取72.1语音情感识别方法对于语音情感识别,一般的流程如图2-1所示。首先通过麦克风等传感器采集语音信号,对情感语音进行分症加窗等预处理。然后从语音中提取声学特征,进行特征选择或降维,以得到用于分类的情感特征。最后根据所提取特征选择合适的分类模型,辨....
图2-2情感的激活度-效价空间图
天津大学硕士学位论文8OCC模型[24]在认知科学中是众所周知的,但由于其复杂性很高,在计算机科学应用中并未广泛采用。离散情感模型和维度情感模型相互关联,各有利弊。离散情感模型简单,有利于分类任务。维度情感模型可以更好地解决情感描述能力,更好地反应不同情感的微妙差异。2.1.2语....
图2-4MFCC特征提取流程图
第2章语音情感识别方法与特征提取13如表2-2所示,384维语音感知特征由32维低级声学特征(LLDs)及其统计值组成。接下来我们会详细介绍使用最频繁的基频和梅尔频率倒谱系数。2.2.2.1梅尔频率倒谱系数在信号处理中,梅尔频率倒谱(MFC)[27]实质是一种线性余弦变换,基于非....
图3-1M-P神经元模型
第3章基于神经网络模型的语音情感识别153.1神经网络模型3.1.1神经网络模型简介近年来,神经网络模型得到了快速发展,它在计算机视觉、语音信号识别、运动控制等领域都取得了显著的成绩,并且在工业中得到了广泛应用。神经网络的研究很早就被提出,它的网络结构能够模拟生物神经系统对外界环....
本文编号:3969642
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3969642.html