基于胶囊网络的人脸表情特征提取与识别算法研究
发布时间:2021-03-26 18:54
面部表情识别是指对人脸表情进行特征提取和分析,通过表情信息来理解人类情绪。面部表情识别已成为计算机视觉领域的研究热点之一,相关研究具有广泛的应用价值和前景。本文以深度学习为基础,研究面部表情识别算法,充分利用输入图像的空间特征信息,提出了两种面部表情识别算法。本文的主要研究成果如下:(1)研究分析了胶囊网络(Capsules Network,CapsNet)的原理、网络架构及优化算法。胶囊网络针对类似人脸的结构化目标的图像所提特征具有良好的方向性,能更好地捕捉面部运动单元(Action Unit,AU)间的细节和关系。RAF-DB和FER2013表情数据集上的表情识别效果验证了胶囊网络的特征表达和分类能力,即CapsNet算法在RAF-DB表情数据集上的识别准确率为76.12%;与CNN模型相比,CapsNet算法在FER2013表情数据集上识别准确率提高了 1.87%。(2)提出了 一种基于增强胶囊网络(Enhanced Capsules Network,E-CapsNet)的表情识别算法。VGG网络作为深度卷积神经网络,其在表情识别领域的成功应用表明,深层抽象特征有利于表情分类,而...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图1-1面部动作编码系统实例w??
图2-1胶囊的层级结构图示例??Figure?2-1?The?example?of?capsule?hierarchy?diagram??图2-1为胶囊的层级结构图示例,分为两个部分,第一部分是m,与Gy|/间的线??性组合,第二部分是,.与\间的动态路由过程。最下面的层级共有两个胶囊单元??W1和W2,之后传递到下一层级共有5个胶囊单元V1、V2、V3、V4和V5。M1和M2是??胶囊的输入向量,即含有一组神经元的胶囊单元,分别与不同的权重向量%相乘??得到&,.。例如M2与%3相乘得到&2,然后该预测向量和对应的耦合系数c23相乘??传到输入向量&。不同胶囊单元的输入向量\是所有可能传入该单元的预测向量??的加权和,即所有可能传入的预测向量?与对应耦合系数%的乘积和。得到不同??的输入向量\之后,输入到“squashing”非线性函数中,得到后一层的胶囊单元的??输出向量^.。利用该输出向量\和对应预测向量的相乘更新耦合系数4。??动态路由算法如表2-1所示[36]。??表2-1动态路由算法??Table?2-1?The?algorithm?of?dynamic?routing??路由算法???1:?Routing?(^,,r,/)??2:对于所有/层的胶囊/和/+i层的胶囊y:??3:?迭代r次??4.?对于所有/层的胶囊i:?cy+^-softmax(\)??5.?对于所有
的长度为8的向量彼此权重共享,具有不同特征映射的特点。??数字胶囊层(DigitCaps层)采用每个胶囊活动向量的长度代表出现的每个类??别的概率,并用于计算分类损失。胶囊的编码结构如图2-2所示。??Convl?PrimaryCaps?DigitCaps??函隱??—20—‘?16??6??图2-2胶囊网络的编码结构??Figure?2-2?The?coding?architecture?of?the?CapsNet??12??
【参考文献】:
期刊论文
[1]基于图像的面部表情识别方法综述[J]. 徐琳琳,张树美,赵俊莉. 计算机应用. 2017(12)
硕士论文
[1]基于深度学习的图像精细分类研究[D]. 季亮.中国矿业大学 2018
[2]基于深度学习的人脸属性识别方法研究[D]. 谭莲芝.中国科学院大学(中国科学院深圳先进技术研究院) 2017
本文编号:3102079
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图1-1面部动作编码系统实例w??
图2-1胶囊的层级结构图示例??Figure?2-1?The?example?of?capsule?hierarchy?diagram??图2-1为胶囊的层级结构图示例,分为两个部分,第一部分是m,与Gy|/间的线??性组合,第二部分是,.与\间的动态路由过程。最下面的层级共有两个胶囊单元??W1和W2,之后传递到下一层级共有5个胶囊单元V1、V2、V3、V4和V5。M1和M2是??胶囊的输入向量,即含有一组神经元的胶囊单元,分别与不同的权重向量%相乘??得到&,.。例如M2与%3相乘得到&2,然后该预测向量和对应的耦合系数c23相乘??传到输入向量&。不同胶囊单元的输入向量\是所有可能传入该单元的预测向量??的加权和,即所有可能传入的预测向量?与对应耦合系数%的乘积和。得到不同??的输入向量\之后,输入到“squashing”非线性函数中,得到后一层的胶囊单元的??输出向量^.。利用该输出向量\和对应预测向量的相乘更新耦合系数4。??动态路由算法如表2-1所示[36]。??表2-1动态路由算法??Table?2-1?The?algorithm?of?dynamic?routing??路由算法???1:?Routing?(^,,r,/)??2:对于所有/层的胶囊/和/+i层的胶囊y:??3:?迭代r次??4.?对于所有/层的胶囊i:?cy+^-softmax(\)??5.?对于所有
的长度为8的向量彼此权重共享,具有不同特征映射的特点。??数字胶囊层(DigitCaps层)采用每个胶囊活动向量的长度代表出现的每个类??别的概率,并用于计算分类损失。胶囊的编码结构如图2-2所示。??Convl?PrimaryCaps?DigitCaps??函隱??—20—‘?16??6??图2-2胶囊网络的编码结构??Figure?2-2?The?coding?architecture?of?the?CapsNet??12??
【参考文献】:
期刊论文
[1]基于图像的面部表情识别方法综述[J]. 徐琳琳,张树美,赵俊莉. 计算机应用. 2017(12)
硕士论文
[1]基于深度学习的图像精细分类研究[D]. 季亮.中国矿业大学 2018
[2]基于深度学习的人脸属性识别方法研究[D]. 谭莲芝.中国科学院大学(中国科学院深圳先进技术研究院) 2017
本文编号:3102079
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3102079.html