基于集成卷积神经网络的面部表情识别研究与应用
发布时间:2020-12-31 09:50
面部表情识别一直以来是一个有趣且富有挑战性的问题,在实际应用中容易受到各种因素的影响,诸如光照、姿势、面部遮挡、年龄、种族等因素。据研究表明,传统手工提取的特征无法解决与面部表情无关的各种因素,为了解决这一问题本文采用卷积神经网络(Convolutional Neural Network,CNN),可以输入原始数据,将特征提取和分类结合,其模型拥有数千万参数可以处理大量的训练样本,是一个强大的自动特征提取器。目前最先进的算法表明,使用CNN集成可以胜过单个CNN分类器。因此,本文针对以上问题对优化卷积神经网络结构、学习基本分类器的最佳组合规则来提高表情识别精度开展研究。主要工作及创新点如下:1、受VGG网络整洁结构以及Xception结构的启发,设计了3个不同结构化子卷积神经网络,以保证网络的互补性,紧凑而有效的网络设计使其足以完成任务并易于训练。通过引入全局平均池化层代替全连接层减少模型参数量,同时保证了模型识别率,引入包含4个残差深度可分离卷积模块可以在加深网络的同时进一步减少网络参数。此外在网络中加入批量归一化和L2范式以解决过拟合问题、提高网络泛化能力。在CK+数据集和FER-...
【文章来源】:青岛大学山东省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
AlexNet网络模型
GoogLeNet结构
青岛大学硕士学位论文12图2.3Inception模块(3)VGGNet2014年著名的牛津大学视觉组提出VGG网络[58],并取得了ILSVRC-2014比赛定位任务的第一名和分类任务的第二名。这是一种只专注于构建卷积层的简单网络,结构规整,没有那么多的超参数,一个重要特性是由许多具有3×3小滤波器的卷积层彼此堆叠来模仿出更大的感受野的效果,而不是像先前的CNN模型那样使用具有更大滤波器尺寸的单个卷积层。网络配置如图2.4[58]所示。随着添加更多的层(所添加的层以粗体显示),配置的深度从左侧(A)向右侧(E)增大。卷积层参数被表示为“感受域大小i-通道数h”,为简洁起见,未显示ReLU激活功能。在VGG网络结构中,为了保证卷积后的图像大小不变,对图像四周各填充1个像素。池化层大小都为2×2,步长为2。有3层全连接层,分别包括4096、4096、1000个节点。VGG网络的所有层都采用了ReLU激活函数,除最后一个全连接层外。与AlexNet相比,VGG去掉了局部响应归一化层(LocalResponseNormalization,LRN),因为作者在实验中发现LRN的作用并不明显。后续的网络架构中也应用了这些思想,比如Inception与ResNet。目前仍经常用VGG网络来提取图像特征,其拓展性很强,迁移到其他图片数据上的泛化性很好,被广泛应用于计算机视觉领域的各类任务。在文献[59]中对VGG16网络进行微调构建了一个加权混合深度神经网络来自动提取特征,其处理面部灰度图像及其相应的局部二值模式面部图像这两个通道,输出以加权方式进行融合,局部二值模式和灰度人脸图像的有效结合保证了泛化能力。
【参考文献】:
期刊论文
[1]人脸微表情识别综述[J]. 徐峰,张军平. 自动化学报. 2017(03)
[2]基于ROI-KNN卷积神经网络的面部表情识别[J]. 孙晓,潘汀,任福继. 自动化学报. 2016(06)
本文编号:2949408
【文章来源】:青岛大学山东省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
AlexNet网络模型
GoogLeNet结构
青岛大学硕士学位论文12图2.3Inception模块(3)VGGNet2014年著名的牛津大学视觉组提出VGG网络[58],并取得了ILSVRC-2014比赛定位任务的第一名和分类任务的第二名。这是一种只专注于构建卷积层的简单网络,结构规整,没有那么多的超参数,一个重要特性是由许多具有3×3小滤波器的卷积层彼此堆叠来模仿出更大的感受野的效果,而不是像先前的CNN模型那样使用具有更大滤波器尺寸的单个卷积层。网络配置如图2.4[58]所示。随着添加更多的层(所添加的层以粗体显示),配置的深度从左侧(A)向右侧(E)增大。卷积层参数被表示为“感受域大小i-通道数h”,为简洁起见,未显示ReLU激活功能。在VGG网络结构中,为了保证卷积后的图像大小不变,对图像四周各填充1个像素。池化层大小都为2×2,步长为2。有3层全连接层,分别包括4096、4096、1000个节点。VGG网络的所有层都采用了ReLU激活函数,除最后一个全连接层外。与AlexNet相比,VGG去掉了局部响应归一化层(LocalResponseNormalization,LRN),因为作者在实验中发现LRN的作用并不明显。后续的网络架构中也应用了这些思想,比如Inception与ResNet。目前仍经常用VGG网络来提取图像特征,其拓展性很强,迁移到其他图片数据上的泛化性很好,被广泛应用于计算机视觉领域的各类任务。在文献[59]中对VGG16网络进行微调构建了一个加权混合深度神经网络来自动提取特征,其处理面部灰度图像及其相应的局部二值模式面部图像这两个通道,输出以加权方式进行融合,局部二值模式和灰度人脸图像的有效结合保证了泛化能力。
【参考文献】:
期刊论文
[1]人脸微表情识别综述[J]. 徐峰,张军平. 自动化学报. 2017(03)
[2]基于ROI-KNN卷积神经网络的面部表情识别[J]. 孙晓,潘汀,任福继. 自动化学报. 2016(06)
本文编号:2949408
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2949408.html