高斯混合模型用于语音情感识别研究

发布时间：2017-08-16 04:11

本文关键词：高斯混合模型用于语音情感识别研究

【摘要】：语音情感识别技术是人工智能(AI)领域的一个重要分支,该技术是通过对语音信号进行分析处理来识别说话者当时的情感状态。随着计算机科学技术与其他学科如生理学、心理学、统计学等相互交叉和发展,语音情感识别技术获得了显著的进展。情感自身具有主观性和复杂性,对情感进行建模,开展情感计算研究具有重大的理论和实践意义。随着计算机技术和机器智能技术的发展,越来越多的人工智能设备和产品将会被开发出来,并会在社会生活的各个领域中得到广泛的应用,如教育行业、医学界、服务行业和工业等领域。本文采用高斯混合模型,对语音情感识别问题做了较系统的研究。首先,基于情感理论基础知识确立了本文的实验语料库,并选取了四种基本情感状态作为本文的研究对象,即生气、高兴、恐惧、悲伤。接着对语音信号进行预处理操作,便于提取更为有效的情感特征。其次,鉴于语音情感特征提取的好坏将会直接影响识别的效果,所以本文的特征参数提取兼顾韵律学、音质以及谱等三个方面,这些特征分别是语速、短时能量、基音频率、共振峰参数以及Mel频率倒谱系数(MFCC)五类特征,对这一系列特征进行提取计算和分析研究,最终确定了21种语音情感特征作为高斯混合模型(GMM)的输入参数。再次,通过选取不同的情感特征和不同的识别模型进行实验,寻找能区分各种情感的有效情感特征。本文先选用支持向量机(SVM)模型进行识别,通过对比不同的核函数的识别效果决定选用线性核,并且使用网格搜索法确定了用于识别的最优参数；然后采用层次模型决策树、分层模型分别进行识别。最后,利用已确定的21种语音情感特征和高斯混合模型在语料库的训练数据集上对四种基本情感建立识别模型。在建模的过程中,使用到了极大似然估计(MLE)和期望最大化(EM)算法对高斯混合模型的参数进行优化。在进行优化训练的过程中,极大似然估计详细推演了期望最大化算法迭代并直到最后收敛的过程。最终确定了最优的高斯混合模型,并使用该模型在测试数据集上进行了识别实验。同时对其他三种识别模型(即支持向量机、决策树和分层模型)的实验结果做了详细的分析,最后通过对比分析四种模型的实验结果说明了使用高斯混合模型在本文选取的四种基本情感进行识别时具有更强的区分能力,同时也验证了期望最大化算法的参数估计对高斯混合模型的识别率具有重大影响。
【关键词】：语音情感识别 特征提取 支持向量机(SVM) 高斯混合模型(GMM) 期望最大化(EM)
【学位授予单位】：广西师范大学
【学位级别】：硕士
【学位授予年份】：2016
【分类号】：TN912.34
【目录】：

摘要3-5
Abstract5-9
第一章绪论9-13
1.1 语音情感识别研究背景及意义9-10
1.2 语音情感识别历史概述10-11
1.3 语音情感识别国内外研究现状11-12
1.4 语音情感识别所面临的问题12
1.5 论文的章节安排12-13
第二章情感理论的基础13-19
2.1 情感的定义13
2.2 情感的分类13-16
2.2.1 离散情感模型13-14
2.2.2 维度情感模型14-16
2.2.3 两种情感模型的比较16
2.3 情感语料库的建立16-18
2.3.1 代表性的情感语料库介绍16-17
2.3.2 本文选用的语料库17-18
2.4 本章小结18-19
第三章语音信号的预处理和情感特征参数的提取19-36
3.1 语音信号的预处理19-24
3.1.1 预加重处理19-20
3.1.2 分帧加窗处理20-23
3.1.3 语音信号的端点检测23-24
3.2 语音情感特征的提取24-35
3.2.1 语速25
3.2.2 短时能量25-29
3.2.3 基音频率29-32
3.2.4 共振峰32-33
3.2.5 Mel频率倒谱系数33-35
3.3 本章小结35-36
第四章语音情感的识别模型36-47
4.1 支持向量机36-42
4.1.1 支持向量机理论36-39
4.1.2 支持向量机多分类39-40
4.1.3 实验及结果分析40-42
4.2 层次模型42-45
4.2.1 决策树基本流程42-43
4.2.2 决策树实验及结果分析43-44
4.2.3 分层模型实验及结果分析44-45
4.3 本章小结45-47
第五章语音基本情感的高斯混合模型47-55
5.1 高斯混合模型的理论基础47
5.2 语音基本情感的高斯混合模型的实验47-53
5.2.1 GMM模型参数初始化48
5.2.2 GMM模型参数估计48-52
5.2.3 GMM模型的语音基本情感识别52-53
5.3 实验结果分析53-54
5.4 本章小结54-55
第六章总结和展望55-57
6.1 总结55
6.2 展望55-57
参考文献57-61
致谢61-62

，

本文编号：681363

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/681363.html

上一篇：一种基于BP及RM算法的柱面近场三维RCS成像算法
下一篇：DOA估计中的稳健稀疏重构模型及算法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|