基于ANN和GMM融合的语音情感识别方法的研究
发布时间:2017-06-25 09:17
本文关键词:基于ANN和GMM融合的语音情感识别方法的研究,由笔耕文化传播整理发布。
【摘要】:人机交互是人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程,是计算机智能的重要体现,同时也可以让计算机更好的为人类服务。语音情感识别对发展人机交互来说至关重要。目前,语音情感识别的研究是一门综合认知科学、生理学、心理学、语言学、计算机科学等多学科的热点研究课题,正越来越受到国内外科研机构和研究人员的重视。本文主要围绕人工神经网络和高斯混合模型展开语音情感识别的研究,在原有结构模型的基础上从算法层面入手提出改进的方法,以期提高相关模型的识别精度和识别效率,并在文章最后提出了一种高斯混合模型和神经网络混合的语音情感识别模型。本论文的主要研究内容和创新点如下:(1)阐述了语音情感识别的研究背景与意义,总结了当前国内外的研究现状,并对当前有待深入研究和亟待解决的理论和技术问题进行了说明。(2)概述了与情感相关的一些基础知识,包括情感的定义与情感的分类。设计并录制了汉语语音情感数据库,该库包含高兴、愤怒、惊讶、悲伤等四种基本情感,且全部语音样本都经过有效性检验以确保数据符合规范。完成了语音情感识别过程中需要进行的预处理工作,简述了本文所用到的情感特征参数的提取方式以及情感特征向量的归一化方法。(3)研究了基于Elman神经网络的语音情感识别,并运用万有引力搜索算法(Gravitational Search Algorithm, GSA)以Elman网络进行优化,算法的核心思想是运用万有引力定律通过位置寻优来不断更新网络的权值参数,最终实现网络的最优化。(4)介绍了高斯混合模型(GMM)的EM优化算法,并分析了传统EM算法的缺点。由此本文研究了一种基于改进的GMM算法的语音情感识别方法,该算法通过设定一个初始GMM模型,运用迭代方式不断修正M值和GMM网络的参数,直至得到最终的GMM模型。(5)研究了GMM和深度信念网络融合的语音情感识别方法。在受限玻尔兹曼机(Restricted Boltzmann Machines, RBM)模型基础上构建深度信念网络(Deep Belief Network, DBN),最后提出了一种多维GMM输出与深度信念神经网络相融合的方法实现语音情感识别。
【关键词】:语音情感识别 埃尔曼递归神经网络 万有引力算法 高斯混合模型 深度信念网络
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要5-6
- Abstract6-9
- 第一章 绪论9-13
- 1.1 研究背景及其意义9-10
- 1.2 语音情感识别的研究现状10
- 1.3 语音情感识别关键技术问题10-12
- 1.3.1 语音情感数据库问题11
- 1.3.2 情感特征参数的提取11-12
- 1.3.3 高效、稳定的情感识别算法12
- 1.4 本文的研究内容与文章结构12-13
- 第二章 语音情感识别基础13-27
- 2.1 情感的基础知识13-15
- 2.1.1 情感的定义13
- 2.1.2 情感的分类13-15
- 2.2 汉语语音情感数据库的建立15-18
- 2.2.1 表演型情感语音16
- 2.2.2 引导型情感语音16-17
- 2.2.3 自然型情感语音17
- 2.2.4 汉语语音情感数据库的建立17-18
- 2.3 语音情感信号的预处理18-20
- 2.3.1 预加重18
- 2.3.2 分帧加窗18-20
- 2.3.3 端点检测20
- 2.4 语音情感特征的提取与计算20-26
- 2.4.1 短时能量和短时平均幅度20-21
- 2.4.2 短时过零率21
- 2.4.3 语速21-22
- 2.4.4 基音频率22
- 2.4.5 共振峰22-23
- 2.4.6 梅尔频率倒谱系数23-26
- 2.5 语音情感特征归一化26
- 2.6 本章小结26-27
- 第三章 神经网络理论与基于递归神经网络的语音情感识别27-43
- 3.1 传统人工神经网络基本理论27-33
- 3.1.1 神经网络概念27-28
- 3.1.2 人工神经网络的分类28-29
- 3.1.3 人工神经网络的学习算法29-33
- 3.2 递归神经网络33-37
- 3.2.1 递归神经网络的多种结构模型33-35
- 3.2.2 Elman递归神经网络35-36
- 3.2.3 Elman神经网络的BP学习算法36-37
- 3.3 基于万有引力搜索算法的Elman模型优化37-40
- 3.3.1 万有引力搜索算法37-39
- 3.3.2 Elman模型的万有引力优化方法39-40
- 3.4 情感识别实验与实验结果分析40-41
- 3.4.1 情感实验特征参数的设置40
- 3.4.2 情感实验中网路训练相关参数设置40
- 3.4.3 情感实验结果与分析40-41
- 3.5 本章小结41-43
- 第四章 基于改进GMM的语音情感识别43-53
- 4.1 传统GMM模型概述43-48
- 4.1.1 GMM模型43-44
- 4.1.2 GMM的EM算法44-47
- 4.1.3 GMM模型建立流程47-48
- 4.2 改进的GMM48-51
- 4.2.1 有限混合模型的无监督学习算法48-49
- 4.2.2 改进的GMM算法49-51
- 4.3 情感识别实验与实验结果分析51-52
- 4.4 本章小结52-53
- 第五章 基于深度神经网络与GMM融合的语音情感识别53-63
- 5.1 深度学习神经网络基本理论53-58
- 5.1.1 深度神经网络的训练过程53
- 5.1.2 深度学习常用模型结构53-58
- 5.2 基于深度神经网络与GMM融合的情感识别58-61
- 5.2.1 softmax分类器58
- 5.2.2 基于广义线性判别优化算法的深度神经网络58-60
- 5.2.3 基于深度神经网络与GMM融合的语音情感识别60-61
- 5.3 情感识别实验与实验结果分析61-62
- 5.4 本章小结62-63
- 第六章 总结与展望63-65
- 致谢65-67
- 参考文献67-70
【参考文献】
中国期刊全文数据库 前8条
1 李春龙;戴娟;潘丰;;引力搜索算法中粒子记忆性改进的研究[J];计算机应用;2012年10期
2 张永皋;马青玉;孙青;;基于MFCC和CHMM技术的语音情感分析及其在教育中的应用研究[J];南京师范大学学报(工程技术版);2009年02期
3 姜晓庆;崔世耀;殷艳华;;人机语音交互中的情感语音处理[J];济南大学学报(自然科学版);2008年04期
4 孙亚;;远程教学中语音情感识别系统的研究与实现[J];长春理工大学学报(高教版);2008年02期
5 刘明辉;戴蓓劏;解焱陆;;基于GMM多维概率输出的SVM话者确认[J];模式识别与人工智能;2008年01期
6 余伶俐;蔡自兴;陈明义;;语音信号的情感特征分析与识别研究综述[J];电路与系统学报;2007年04期
7 谷学静,石志国,王志良;基于BDI Agent技术的情感机器人语音识别技术研究[J];计算机应用研究;2003年04期
8 冯天瑾,陈哲,熊建设;多层感知器网络内部判决模式的研究[J];数据采集与处理;2000年04期
中国硕士学位论文全文数据库 前1条
1 韩文静;基于神经网络的语音情感识别技术研究[D];哈尔滨工业大学;2007年
本文关键词:基于ANN和GMM融合的语音情感识别方法的研究,,由笔耕文化传播整理发布。
本文编号:481609
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/481609.html