基于卷积神经网络的人脸表情识别研究
发布时间:2020-04-19 01:53
【摘要】:由于人机交互研究的不断深入以及巨大的应用前景,对人脸面部表情进行识别和分析已成为计算机视觉中非常重要、活跃和流行的课题。在过去几年中,深度学习在许多应用领域均取得了突破性成果,包括语音识别、图像理解、自然语言处理等。与传统方法用人工提取图像的几何、纹理特征不同,本文使用深度学习的卷积神经网络方法自动提取人脸图像特征,对人脸表情识别问题进行了研究,具体研究内容包括以下几点:1.尽管卷积神经网络已经被用于许多计算机视觉任务并表现出色,但是现有的网络结构对全连接层的关注却很少。考虑到全连接层在不同尺度下的特征提取能力不同,本文对传统的单通道全连接层进行改进,设计了一种新的双通道卷积神经网络,不仅提高了网络性能,而且增强了网络的特征表达能力。使用传统特征提取方法易出现识别错误率高,对光照、姿态和遮挡变化容忍度差等问题,本文设计的双通道卷积神经网络模型能有效解决这些缺点。2.传统的激活函数都只能拟合二维函数,Maxout却可以拟合任意维度的函数,为了能够更精确地表达高维特征信息,在全连接层用Maxout激活函数代替传统的ReLU激活函数;与传统的激活函数相比,Maxout激活函数的输出具有非稀疏性,将其与Dropout技术结合使用,Dropout用在Maxout网络层的后面,优化了网络内部结构。3.理想的面部表情特征具有比最小的类间距离更小的最大类内距离,但现有算法很少能有效地实现这一标准。本文在模型训练过程中使用A-Softmax损失,通过操纵特征面产生角度间隔,使用角度作为距离度量,将角度距离和学习到的特征相结合,增强了对不同面部表情特征的辨别能力。4.设计并实现了人脸动态表情识别系统,并使用不同卷积神经网络模型进行了动态表情识别实验,结果表明,双通道卷积神经网络具有较好的识别准确度和实时性,可应用于实时的人脸表情识别。
【图文】:
图 2-1 神经元模型 2-1 中,单个神经元与其它若干个神经元进行连接,并接收经元传递过来的信号作为输入信号,这些输入信号通过带权之间进行传递,,神经元将接收到的输入信号的总输入值与该比较,并通过“激活函数”处理从而产生神经元的输出。将元按照一定的层次结构进行连接,就得到了神经网络。知机模型机一共由两层神经元构成,如图 2-2 所示,输入层神经元接并将接收到的输入信号传递给输出层的神经元,公式(2-1)出层的神经元进行激活处理。y f ( )(2-1)i i w x (2-2)w i n以及阈值 可通过学习得
图 2-2 两个输入神经元的感知机模型层神经元1x 、2x 接收来自外界的输入信神经元,因为感知机只激活输出层神能力非常有限。现实应用中,更多的称多层感知机(Multilayer Perception,间的神经元被称为隐层或隐含层,隐层的神经元仅与其下一层的神经元完接。MLP 的输入层神经元接收外部输收的信号,最后输出层神经元输出最终模型本结构包含三种不同类型的结构层,分2-3 所示:
【学位授予单位】:长春工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
本文编号:2632792
【图文】:
图 2-1 神经元模型 2-1 中,单个神经元与其它若干个神经元进行连接,并接收经元传递过来的信号作为输入信号,这些输入信号通过带权之间进行传递,,神经元将接收到的输入信号的总输入值与该比较,并通过“激活函数”处理从而产生神经元的输出。将元按照一定的层次结构进行连接,就得到了神经网络。知机模型机一共由两层神经元构成,如图 2-2 所示,输入层神经元接并将接收到的输入信号传递给输出层的神经元,公式(2-1)出层的神经元进行激活处理。y f ( )(2-1)i i w x (2-2)w i n以及阈值 可通过学习得
图 2-2 两个输入神经元的感知机模型层神经元1x 、2x 接收来自外界的输入信神经元,因为感知机只激活输出层神能力非常有限。现实应用中,更多的称多层感知机(Multilayer Perception,间的神经元被称为隐层或隐含层,隐层的神经元仅与其下一层的神经元完接。MLP 的输入层神经元接收外部输收的信号,最后输出层神经元输出最终模型本结构包含三种不同类型的结构层,分2-3 所示:
【学位授予单位】:长春工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【参考文献】
相关期刊论文 前5条
1 童莹;;基于空间多尺度HOG特征的人脸表情识别方法[J];计算机工程与设计;2014年11期
2 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
3 龚劬;叶剑英;华桃桃;;结合改进的LBP和LDP的人脸表情识别[J];计算机工程与应用;2013年22期
4 谭琨;杜培军;;基于径向基函数神经网络的高光谱遥感图像分类[J];光谱学与光谱分析;2008年09期
5 唐京海;张有为;;基于FLD特征提取的SVM人脸表情识别方法[J];计算机工程与应用;2006年11期
本文编号:2632792
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2632792.html