当前位置:主页 > 科技论文 > 软件论文 >

人脸表情识别关键技术的研究

发布时间:2017-04-23 01:04

  本文关键词:人脸表情识别关键技术的研究,由笔耕文化传播整理发布。


【摘要】:无论是语言的还是非语言形式的沟通,在人们的日常生活与工作中都是非常重要的,而面部表情则是非语言沟通中最有效的沟通方式,表情可以为我们提供情感状态、心态、意图等线索。关于面部表情识别的应用也正在渗透至各个领域,如安全驾驶、商品销售、临床医学等等。本文对面部表情识别相关技术进行研究,主要工作及贡献如下:(1)基于WPCANet及分块加权直方图的静态表情识别。.将分块WPCA的非监督式滤波器组的学习与深度卷积神经网络的多阶段特征提取结构相结合,构建WPCANet网络模型,实现关于静态人脸表情特征的非监督式多阶段提取;进一步基于训练样本的表情类别信息,生成体现类鉴别特性的权重图像,在此基础上实现关于人脸表情样本特征的加权分块直方图描述;最终结合线性C-SVM分类模型,完成基于静态人脸图像的七种基本表情类型的识别。基于JAFFE静态表情库的实验验证了算法的有效性。(2)基于多视觉描述子及音频特征的动态表情识别。研究非约束条件下人脸动态表情识别,提出了一种基于多视觉描述子及音频特征融合策略的动态表情识别算法。借助多视觉描述子的空时局部特征描述实现动态表情特征的提取;而视频、音频特征的融合策略改善了表情识别性能。基于协方差矩阵及时间轴分段的动态规整,有效地解决了具有不同时长的动态表情序列的样本描述。为进一步改善表情识别模型的泛化性能,本文引入了基于多个体识别模型加权投票的集成识别模型。针对投票过程中的权值学习,提出了基于随机重采样的投票权重学习,以及基于个体分类模型相对优势的投票权重学习方法。集成决策进一步改善了表情识别性能。基于AFEW5.0的动态表情库实验验证了算法的有效性。
【关键词】:表情识别 WPCANet 加权直方图 多视觉描述子 集成分类器 权重学习
【学位授予单位】:河北师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
  • 摘要4-5
  • Abstract5-10
  • 1 绪论10-20
  • 1.1 研究背景及意义10-12
  • 1.2 人脸表情识别问题的描述12-13
  • 1.3 国内外研究现状13-18
  • 1.3.1 现有的人脸表情数据库13-15
  • 1.3.2 人脸表情特征的提取15-17
  • 1.3.3 人脸表情的分类17-18
  • 1.4 本文主要研究内容18-20
  • 2 深度学习及其典型模型20-36
  • 2.1 深度学习的基本概念20-21
  • 2.2 典型的深度学习结构21-35
  • 2.2.1 自编码器(Auto-Encoder, AE)21-25
  • 2.2.2 受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)25-30
  • 2.2.3 深度置信网络(Deep Belief Network, DBN)30-32
  • 2.2.4 卷积神经网络(Convolutional Neural Network, CNN)32-35
  • 2.3 本章小结35-36
  • 3 基于WPCANet与加权直方图的静态图像人脸表情识别36-60
  • 3.1 PCANet深度学习框架的引入36-43
  • 3.1.1 PCANet网络结构的第一阶段特征提取39-40
  • 3.1.2 PCANet网络结构的第二阶段特征提取40-41
  • 3.1.3 PCANet网络结构的输出阶段:哈希编码与直方图描述41-43
  • 3.2 基于WPCANet与分块加权直方图的表情特征提取43-46
  • 3.2.1 WPCANet网络结构的提出43-44
  • 3.2.2 基于面部不同位置表情类型鉴别差异的加权直方图描述44-46
  • 3.3 基于C-SVM分类模型的表情识别46-53
  • 3.3.1 面向两类别分类问题的线性SVM46-49
  • 3.3.2 面向两类别分类问题的核SVM49-51
  • 3.3.3 基于两类别SVM的多类别分类模型51-53
  • 3.4 实验与分析53-58
  • 3.4.1 人脸表情样本数据的准备53-54
  • 3.4.2 基于WPCANet及空间分块加权直方图的人脸表情特征提取54-56
  • 3.4.3 实验结果分析56-58
  • 3.5 本章小结58-60
  • 4 基于多视觉描述子及音频特征的动态序列人脸表情识别60-95
  • 4.1 AFEW5.0 动态表情库及预处理60-63
  • 4.2 基于多视觉描述子的动态表情局部空时特征提取63-75
  • 4.2.1 基于LBP-TOP算子的动态表情特征提取63-66
  • 4.2.2 基于SIFT算子的动态表情特征提取66-69
  • 4.2.3 基于HOG与HOF的动态表情特征提取69-70
  • 4.2.4 基于MBH算子的动态表情特征提取70-71
  • 4.2.5 基于二维Gabor小波变换的动态表情特征提取71-73
  • 4.2.6 基于分块二维DCT变换的动态表情特征提取73-75
  • 4.3 音频特征的获取75-76
  • 4.4 表情视频片段的特征表述76-77
  • 4.4.1 多视觉描述子的时间规整76-77
  • 4.4.2 特征融合策略77
  • 4.5 表情视频片段分类77-80
  • 4.5.1 偏最小二乘分类器77-79
  • 4.5.2 支持向量机79-80
  • 4.6 多识别模型的集成80-83
  • 4.6.1 多识别模型集成的必要性80
  • 4.6.2 基于加权投票机制的多识别模型集成决策80-81
  • 4.6.3 基于随机重采样的投票权重学习81-83
  • 4.6.4 基于个体分类模型相对优势的投票权重学习83
  • 4.7 实验与分析83-93
  • 4.7.1 参数设置83-84
  • 4.7.2 基于多视觉描述子的动态表情特征描述84-88
  • 4.7.3 实验结果比较88-93
  • 4.7.4 基于加权投票的多个体识别模型集成决策93
  • 4.8 本章小结93-95
  • 5 总结与展望95-97
  • 5.1 工作总结95
  • 5.2 工作展望95-97
  • 参考文献97-104
  • 致谢104

【相似文献】

中国期刊全文数据库 前10条

1 孙蔚;王波;;人脸表情识别综述[J];电脑知识与技术;2012年01期

2 杨梅娟;;人脸表情识别综述[J];甘肃科技;2006年04期

3 刘晓e,

本文编号:321565


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/321565.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8198b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com