基于深度学习的活体检测网络研究与实现
发布时间:2021-10-22 06:29
深度学习在面部活体检测领域已取得了较为显著的成果,然而在处理遮挡、光照、角度不当、AI换脸等复杂条件下的面部图片时,因难以预测数目较多的面部特征点集合,使得活体检测的准确率较差。为了提升活体检测的准确性,在现有解决方案中主要分为基于回归模型的方法与深度学习的方法。总体来讲,深度学习的理论基础源自于基于回归模型的方法,但是基于深度学习的方法做出了巨大的改进优化——深度学习以机器学习的方式代替了人为构建向量模型的复杂过程,并取得了更好的预测效果。然而深度学习在实际应用中,因受到各种干扰因素的影响,会出现活体检测准确率较差的问题。因此,本文对这些基于回归模型的方法与基于深度学习的神经网络模型展开研究,针对几种基于深度学习的网络模型做出改进,设计出了一种基于VGG-Res Net双层神经网络模型,用以提升活体检测的准确率。论文主要贡献如下:(1)为了提高面部特征点定位在有干扰因素影响下的准确率,本文在第一层设计了一种基于C-Canny算法与改进VGG相结合的网络模型。这一层网络用以实现人脸对齐与面部特征点定位功能,具体流程如下:首先,在人脸对齐阶段,通过C-Canny算法进行面部区域重定位,得...
【文章来源】:河南大学河南省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
活体检测网络架构图
基于深度学习的活体检测网络研究与实现12络模型的原因是,该模型与AlexNet模型相比,使用的是连续的3x3卷积核。代替了AlexNet中的较大卷积核(11x11,7x7,5x5),这就使得对于给定的感受野中(与输出有关的输入图片的局部大小),采用堆积的小卷积核是优于采用大的卷积核,因为多层非线性层可以增加网络深度来保证学习更复杂的模式,而且代价还比较小(参数更少)。但是,该神经网络模型也存在一定缺陷。当处理图片噪声区域较大的图像时,不能较好的定位面部区域,使得面部特征点定位结果较差。因此,本章节还提出了一种C-Canny面部区域重定位算法。该算法能够对图像中的面部边界信息进行较好的预测,通过定位面部边界信息,再加之相应的边缘放缩技巧,可以有效的进行人脸对齐,进而提取出更为精确的面部区域,提升特征点定位的准确率。第一层局部感受野网络模型如图3-1所示:图3-1局部感受野网络模型3.3神经网络结构设计本文设计的神经网络参考的是VGG-16网络结构,因为本文第一层网络不牵扯到概率计算问题,因此不需要传统VGG-16网络结构中的softmax层,并且将输入层的参数更改为了(128,128,3),进一步加速了特征点定位的速度。本文设计的网络还包含7个卷积层4个池化层以及1个全连接层,在一次或两次卷积操作以后紧跟一个池化层进行特征提龋具体结构参数如表3-1所示:
第3章基于局部感受野的面部特征点定位设计13表3-1CNN结构参数层类型参数层类型参数1输入层(128,128,3)2卷积层(3,3,32)3池化层(2,2,2)4卷积层(3,3,32)5池化层(2,2,2)6卷积层(2,2,2)7卷积层(2,2,2)8池化层(2,2,2)9卷积层(2,2,2)10卷积层(2,2,2)11池化层(2,2,1)12卷积层(3,3,256)13全连接102414输出层136图3-2VGG-16网络结构图神经网络输入层的参数是(128,128,3)的彩色图像以及相对应的(68,2)面部特征点坐标。为方便网络分批次迭代训练,需对特征点集合进行一元展开即维度变为了(136,n)的一维向量格式,其中n为数据集的样本总数。图3-2中网络层数的确定是参考Cascade神经网络模型,该模型采用的是双层网络结构,目标是进行人脸相似度判断。而本文研究的是面部特征点定位,因此在原有网络模型的基础上进行改进,设计出一种基于单个VGG-16的神经网络模型。其卷积输出的计算公式见3-1:N(WF2P)S(3-1)其中,N为输出的结果,W为每一层图像的输入维度,F为卷积层参数,S为步长,P为扩充的边缘像素值。进行卷积运算的意义主要有两方面:一方面是进行局部感知野计算,局部感受野这个概念认为:人对外界的认知是从局部到全局的。因此图像内部的联系也是由局部到整体的,并且特征点分布具有区域性,每个神经元无需对全局图像进行感知,只需对特定局部区域进行特征提取,然后在更高层将这些局部的信息综合起来就得到了想要预测的面部特征。另一方面,局部感受野有助于权值共享计算,在卷积过
本文编号:3450557
【文章来源】:河南大学河南省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
活体检测网络架构图
基于深度学习的活体检测网络研究与实现12络模型的原因是,该模型与AlexNet模型相比,使用的是连续的3x3卷积核。代替了AlexNet中的较大卷积核(11x11,7x7,5x5),这就使得对于给定的感受野中(与输出有关的输入图片的局部大小),采用堆积的小卷积核是优于采用大的卷积核,因为多层非线性层可以增加网络深度来保证学习更复杂的模式,而且代价还比较小(参数更少)。但是,该神经网络模型也存在一定缺陷。当处理图片噪声区域较大的图像时,不能较好的定位面部区域,使得面部特征点定位结果较差。因此,本章节还提出了一种C-Canny面部区域重定位算法。该算法能够对图像中的面部边界信息进行较好的预测,通过定位面部边界信息,再加之相应的边缘放缩技巧,可以有效的进行人脸对齐,进而提取出更为精确的面部区域,提升特征点定位的准确率。第一层局部感受野网络模型如图3-1所示:图3-1局部感受野网络模型3.3神经网络结构设计本文设计的神经网络参考的是VGG-16网络结构,因为本文第一层网络不牵扯到概率计算问题,因此不需要传统VGG-16网络结构中的softmax层,并且将输入层的参数更改为了(128,128,3),进一步加速了特征点定位的速度。本文设计的网络还包含7个卷积层4个池化层以及1个全连接层,在一次或两次卷积操作以后紧跟一个池化层进行特征提龋具体结构参数如表3-1所示:
第3章基于局部感受野的面部特征点定位设计13表3-1CNN结构参数层类型参数层类型参数1输入层(128,128,3)2卷积层(3,3,32)3池化层(2,2,2)4卷积层(3,3,32)5池化层(2,2,2)6卷积层(2,2,2)7卷积层(2,2,2)8池化层(2,2,2)9卷积层(2,2,2)10卷积层(2,2,2)11池化层(2,2,1)12卷积层(3,3,256)13全连接102414输出层136图3-2VGG-16网络结构图神经网络输入层的参数是(128,128,3)的彩色图像以及相对应的(68,2)面部特征点坐标。为方便网络分批次迭代训练,需对特征点集合进行一元展开即维度变为了(136,n)的一维向量格式,其中n为数据集的样本总数。图3-2中网络层数的确定是参考Cascade神经网络模型,该模型采用的是双层网络结构,目标是进行人脸相似度判断。而本文研究的是面部特征点定位,因此在原有网络模型的基础上进行改进,设计出一种基于单个VGG-16的神经网络模型。其卷积输出的计算公式见3-1:N(WF2P)S(3-1)其中,N为输出的结果,W为每一层图像的输入维度,F为卷积层参数,S为步长,P为扩充的边缘像素值。进行卷积运算的意义主要有两方面:一方面是进行局部感知野计算,局部感受野这个概念认为:人对外界的认知是从局部到全局的。因此图像内部的联系也是由局部到整体的,并且特征点分布具有区域性,每个神经元无需对全局图像进行感知,只需对特定局部区域进行特征提取,然后在更高层将这些局部的信息综合起来就得到了想要预测的面部特征。另一方面,局部感受野有助于权值共享计算,在卷积过
本文编号:3450557
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3450557.html