基于语音信息的多特征情绪识别算法研究
发布时间:2017-07-05 03:11
本文关键词:基于语音信息的多特征情绪识别算法研究
【摘要】:情感计算是对与情感相关、来源于情感或者影响情感方面的计算,其目的是赋予智能机器感知,理解和表达各种情感状态的能力。情感识别是情感计算的关键研究内容,是实现和谐人机交互的重要基础。目前,情感计算主要以表情、姿态、语音、文本和生理信号为基础进行情感识别,其中语音信号,是情感信息表达的主要载体,且获取方便,越来越受到研究人员的重视。寻找能够准确表征语音情绪状态的特征参数和有效的情绪状态识别模型是语音情绪识别的主要困难,一直是研究的热点之一。本文主要以语音信息的情感特征参数和情感模型对四种情绪(happy, angry, sad, fear)识别的有效性为研究内容。首先,提取语音信号的样本熵作为一个表征语音情绪状态的特征参数,分析其在语音情绪识别中的区分性,并与传统的声学参数进行特征融合,用于情绪识别;然后,在传统BP网络基础上,结合基于贡献分析的PCA算法,建立了一种基于PCA贡献分析的神经网络语音情感识别模型。对实验结果的分析表明,对样本熵与传统的声学参数进行特征融合可以改进分类器的性能;基于PCA与神经网络建立的语音情感识别模型提高了识别效率。具体研究内容如下:(1)信号获取。根据语音情感信号的产生机理和国际上对情感类型的划分方法,综合比较国内外典型情感语音数据库,最终确定本文的情感类型划分方法和采用的情感语音库。(2)前期处理。对原始数据进行采样、量化、预加重、分帧、加窗等预处理后,针对端点效应问题,本文提出基于样本熵改进的两级判别端点检测算法。采用模糊C均值聚类算法和贝叶斯信息判决算法确定双门限阈值,将其作为第一级判别,初步判断信号的起止点,然后将修正的过零率作为第二级判别,最终确定信号的起止点。(3)特征提取与特征选择。本研究将样本熵及目前比较成熟的声学参数(包括语速、能量特征、基音频率、MFCC)及其统计参数,进行特征融合应用于语音情绪识别。采用PCA贡献分析对原始特征向量集合进行降维,得到最简约向量集,降低网络模型的复杂性,降低训练时间。(4)语音情绪识别模型。本文在传统BP网络基础上,结合基于贡献分析的PCA算法,建立一种基于PCA的神经网络语音信号情感识别模型。基于上述融合的特征,利用该情感模型对800个样本的四种情绪状态进行识别。实验结果分析表明:(a)样本熵是一个能够表征语音信号情感变化的有效参数。样本熵和传统声学特征参数的融合可以显著提高分类器的识别率,改善情感识别模型的性能。(b)基于PCA贡献分析的神经网络语音情感识别模型解决了传统BP算法计算量大,运算速度慢的问题,有效的提高了系统的识别效率。综合考虑以上分析,利用样本熵与传统声学参数进行特征融合,结合基于PCA的神经网络情感识别模型,可以建立有效的语音情感识别系统。
【关键词】:语音情绪识别 样本熵 端点检测 贡献分析
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 摘要10-12
- ABSTRACT12-14
- 第一章 绪论14-22
- 1.1 研究背景及意义14-16
- 1.2 研究现状16-19
- 1.2.1 国外研究现状16-17
- 1.2.2 国内研究现状17-19
- 1.3 立题依据19-20
- 1.4 主要内容及章节安排20-22
- 1.4.1 主要内容20-21
- 1.4.2 章节安排21-22
- 第二章 语音情绪识别的理论基础22-30
- 2.1 语音信号的产生22-23
- 2.2 情绪分类23-24
- 2.3 情感语音库的建立24-27
- 2.3.1 情感语音库的创建方式24-25
- 2.3.2 典型情感语音库25-27
- 2.4 语音情绪识别27-29
- 2.4.1 语音情绪识别的原理27-28
- 2.4.2 语音情绪识别的分类识别算法28-29
- 2.5 本章小结29-30
- 第三章 语音信号的前期处理30-44
- 3.1 情感语音信号的预处理30-32
- 3.1.1 采样与量化30-31
- 3.1.2 预加重31
- 3.1.3 分帧31
- 3.1.4 加窗31-32
- 3.2 传统两级判别端点检测32-38
- 3.2.1 短时能量33
- 3.2.2 短时过零率33-34
- 3.2.3 两级判别端点检测算法34-38
- 3.3 基于样本熵改进的两级判别端点检测38-43
- 3.3.1 样本熵理论及其算法38-39
- 3.3.2 基于样本熵改进的两级判别端点检测算法39-40
- 3.3.3 样本熵门限阈值的确定40-42
- 3.3.4 仿真及结果分析42-43
- 3.4 本章小结43-44
- 第四章 语音信号的特征提取与选择44-58
- 4.1 语音特征与情绪的对应关系44-45
- 4.2 语音信号的特征提取及分析45-53
- 4.2.1 发音速率45-46
- 4.2.2 短时能量特征46-48
- 4.2.3 基音周期和基因频率48-50
- 4.2.4 MFCC50-52
- 4.2.5 样本熵52-53
- 4.3 基于PCA贡献分析的特征选择53-57
- 4.3.1 PCA概述54-55
- 4.3.2 特征选择55-57
- 4.4 本章小结57-58
- 第五章 基于PCA贡献分析的神经网络语音情绪识别58-68
- 5.1 神经网络模型的构建58-64
- 5.1.1 BP网络模型58-59
- 5.1.2 BP网络的学习算法59-63
- 5.1.3 神经网络模型的具体设计63-64
- 5.2 语音情绪识别仿真结果对比分析64-67
- 5.2.1 不同参数下语音情绪识别仿真结果对比分析64-66
- 5.2.2 基于PCA-BP的情绪识别仿真结果对比分析66-67
- 5.3 本章小结67-68
- 第六章 总结与展望68-70
- 6.1 总结68
- 6.2 展望68-70
- 参考文献70-74
- 致谢74-75
- 附件75
【参考文献】
中国期刊全文数据库 前3条
1 赵欢;王纲金;胡炼;彭秀娟;;车载环境下基于样本熵的语音端点检测方法[J];计算机研究与发展;2011年03期
2 马瑞;张盛兵;郑乔石;;一种语音端点检测电路的设计[J];计算机工程与应用;2010年14期
3 邓艳容;景新幸;杨海燕;杨运泽;;语音端点检测研究[J];计算机系统应用;2012年06期
,本文编号:520310
本文链接:https://www.wllwen.com/kejilunwen/wltx/520310.html