当前位置:主页 > 科技论文 > 网络通信论文 >

面向老年人语音与面部表情的情感识别研究

发布时间:2020-05-14 20:26
【摘要】:情感计算是为了赋予计算机识别、理解、表达和适应人类情感的能力,以此实现高效、亲切的人机交互。人类情感有着表情、语音、生理信号等多种载体,进行多种模态的情感识别研究可以促进情感计算的发展。本文从老年人的多模态情感库的建立、语音情感特征提取方法、人脸表情特征提取方法以及情感识别结果等方面展开研究。其主要研究工作及成果总结如下:1.针对目前老年人情感领域研究的缺乏以及情感数据库模态单一的现状,本文在名为《空巢姥爷》的电视连续剧上构建了视频情感数据库、语音情感语料库和人脸表情图像库,并阐述了三种情感库的构建方法和过程。实验结果表明,多模态情感数据库的构建是合理的和有效的。2.针对常用的语音特征的情感识别率不高的问题,本文提出了六层小波包系数模型的老年人的语音特征提取及情感识别方法。分别提取6层小波包系数特征(Wavelet Packet Coefficients,WPC)、动态特征(一阶差分和二阶差分)以及全局特征(最大值、最小值、平均值、中值和方差)共计5760个特征参数。采用主成分分析方法进行特征降维,并选择支持向量机作为分类器。通过与梅尔倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和傅里叶系数(Fourier parameter,FP)比较。实验结果表明,WPC特征模型的语音情感识别率相对于MFCC和FP是更高的,WPC+MFCC特征集也是融合后的特征集里识别率最高的。说明本文提出的方法是有效的。3.针对老年人的人脸表情识别研究不多的情况,本文提出了二维Gabor滤波器模型的老年人的人脸表情特征提取及情感识别方法。本文在空巢姥爷人脸图像库的基础上,使用二维Gabor滤波器精确地提取人脸图像的局部特征。本文使用了具有5个不同尺度和8个不同方向的40个滤波器与图像进行卷积运算,得到图像在不同位置、尺度和方向上的特征。由于提取的图像特征维度较高,需要进行特征降维,本文提出的降维方法是:在滤波之前,先缩减图像尺寸和减少像素个数。然后在滤波过程中,强制抽取部分特征。此方法大大降低了特征维度,而且通过后期实验证明,并没有丢失关键的表情信息,表情依然可以得到较好的分类。最后,本文采用的分类器是多决策神经网络的方法,类似于Adaboost分类的多专家决策思想,并试图让分类器输出多个决策。实验结果表明,本文的方法对于老年人的面部表情识别是有效的,拥有一定的研究价值。
【图文】:

情感,描述模型,二维空间


图 2- 1 Russell 二维空间情感描述模型 2-1 所示为 Russell 二维空间情感描述模型。水平轴为愉悦度轴,表示的正负面程度;原点表示中心情感,纵轴为强度轴,表示情感状态的激如图所示情感将映射在二维空间中,形成高兴、轻松、厌烦、惊恐四种由这四种形成圆环,,因此,该二维空间模型也成为环形情感模型。用的情感类型主要是以连续和离散两种方式进行描述的。连续的方式描符合真实情感之间的变化规律,不过离散的情感类型从情感识别的角方便于分类算法的研究。根据 Ekman 等人提出的六种基本的情绪或其子虑到情感数据库的可用性。本文提出所要建立的情感视频库和语音情使用生气(Angry)、忧虑(Anxiety)、无聊(Boredom)、厌恶(DisgusHappy)、伤心(Sad)以及平静(Neutral)即七种基本的情感类型,情库的七种情感类型只选择了上述情感语音库中的生气(Angry)、厌ust)、高兴(Happy)、中性(Neutral)和伤心(Sad)。另外两种情用了惊讶(Surprise)和害怕(Fear),这样可以扩大情感类型的研究

过程图,过程,情感,空巢


安徽建筑大学硕士学位论文 第二章 多模态情感库的建立2.3 语音情感语料库2.3.1 语音信号的获取1)语音段截取空巢姥爷情感语料库的语料来源与上面视频库一样,均来自《空巢姥爷》这部电视剧,情感类型也是一致的。由于影视作品是以视频的形式呈现,语料的收集过程主要是先通过多媒体格式转化软件格式工厂将视频文件转化为音频文件,将 avi 格式文件转化为 wav 格式文件,然后将转换好格式的音频数据导入到 CoolEdit 进行截取[44]。如图 2-2 所示。
【学位授予单位】:安徽建筑大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.34;TP391.41

【参考文献】

相关期刊论文 前10条

1 闫静杰;郑文明;辛明海;邱伟;;表情和姿态的双模态情感识别[J];中国图象图形学报;2013年09期

2 张少龙;巩知乐;廖海斌;;融合LLE和ISOMAP的非线性降维方法[J];计算机应用研究;2014年01期

3 周晓凤;肖南峰;文翰;;基于情感特征分类的语音情感识别研究[J];计算机应用研究;2012年10期

4 李杰;周萍;;语音情感识别中特征参数的研究进展[J];传感器与微系统;2012年02期

5 徐峻岭;周毓明;陈林;徐宝文;;基于互信息的无监督特征选择[J];计算机研究与发展;2012年02期

6 梁胜杰;张志华;崔立林;钟强晖;;基于主成分分析与核独立成分分析的降维方法[J];系统工程与电子技术;2011年09期

7 何昊青;张雪英;;基于谱减法的语音增强方法及其在ARM中的应用[J];电脑开发与应用;2011年06期

8 黄程韦;金峗;王青云;赵力;邹采荣;;基于语音信号与心电信号的多模态情感识别[J];东南大学学报(自然科学版);2010年05期

9 周晓彦;郑文明;赵力;邹采荣;;基于偏最小二乘回归的人脸身份和表情同步识别方法[J];中国图象图形学报;2009年05期

10 刘培;王建英;尹忠科;;图像光照补偿方法的研究[J];系统工程与电子技术;2008年07期

相关博士学位论文 前3条

1 王坤侠;语音情感识别方法研究[D];合肥工业大学;2015年

2 申丽然;Hilbert-Huang变换及其在含噪语音信号处理中的应用研究[D];哈尔滨工程大学;2006年

3 何良华;人脸表情识别中若干关键技术的研究[D];东南大学;2005年

相关硕士学位论文 前6条

1 何成;基于多生理信号的情绪识别方法研究[D];浙江大学;2016年

2 汤鹏;基于LDA的特征提取及其在人脸识别中的应用[D];河北大学;2015年

3 钟林鹏;说话人识别系统中的语音信号处理技术研究[D];电子科技大学;2013年

4 宣守盼;多模态情感数据库的研究与建立[D];华东理工大学;2013年

5 阴杰敏;基于人耳听觉特性的谱能量特征及其在情感语音识别中的应用[D];太原理工大学;2012年

6 谢环;基于特征选择与融合的语音情感识别研究与实现[D];南京航空航天大学;2008年



本文编号:2663891

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2663891.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b20ec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com