自然场景下基于卷积神经网络的人脸检测与人脸性别识别研究
发布时间:2020-12-20 07:50
人脸特征因其所包含的性别、表情、身份及年龄等大量信息,在公共安全、智能服务、人机交互等领域显得至关重要。基于人脸特征的人脸检测及人脸性别识别如今已是计算机视觉领域的研究重点,但因自然场景下的人脸图像会受到光照、姿态、表情、遮挡、尺寸等因素影响,从而影响人脸检测与人脸性别识别效果。本文在卷积神经网络理论框架下,就自然场景下的人脸检测与人脸性别识别问题开展研究,主要研究内容如下:(1)基于四级级联全卷积神经网络的人脸检测研究传统的人脸检测存在提取特征表征能力较差,以及特征与分类器匹配程度不高等问题。针对上述情况,本文设计了一种基于四级级联全卷积神经网络的人脸检测算法。基本思路是通过构建四级级联网络,采用级联分级训练来代替端到端训练,以避免只共享一个网络权值的局限,进而获得有区分性功能的深度网络,提高检测精度;另外每级网络均设计为全卷积结构,用于提升检测速率;采用自举法进行网络模型的优化训练;最后通过前三级网络逐步检测过滤,同时借助最后一级网络矫正输出来得到人脸检测结果。实验结果表明,本文算法对于自然场景下的多姿态、遮挡、不同肤色人脸等均具有良好的鲁棒性,同时检测速度达到单张86ms,在人脸...
【文章来源】:河北工业大学天津市 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
神经元结构示意图
自然场景下基于卷积神经网络的人脸检测与人脸性别识别研究-10-niiixw1(2.2)则激活函数f变为如下定义:0,001,fy(2.3)即如果0,此时这个神经元被激活,处于兴奋状态,f1;当0时,该神经元被抑制,f0。2.1.2前向传播算法前向传播算法(ForwardPropagation,FP)指在卷积神经网络中由前向后依次进行的推导算法。以简单的三层神经网络为例,如图2.2所示,三层网络由输入层、输出层及隐藏层组成。前向传播为首先将数据从输入层传递给中间的隐藏层,之后再将隐藏层的输出传给输出层,经输出层得到最后的输出结果,整个前向传播过程中每一层神经元状态只会对下一层的神经元产生影响。图2.2三层网络结构示意图假定输入层存在s个神经元,此层神经元用i表示;中间隐藏层有t个神经元,用j表示;最后的输出层有o个神经元,用k来表示。jiv表示i与j连接时对应的权值,kjw表示j与k连接时对应ix的权值。用.1f表示中间隐藏层的激活函数,.2f为输出层对应的激活函数。若输入值为ix,其中si,,...,0那么对于隐藏层的每个神经元输出的值可表示为:t,...,2,1,01jxvfzsiijik(2.4)输出层的每个神经元输出的值为:o,...,2,1,02kzwfyqjkkjj(2.5)
自然场景下基于卷积神经网络的人脸检测与人脸性别识别研究-12-"tyufnnll)((2.12)最后,通过采用灵敏度值对每个神经元进行权值更新。其中第l层的误差对于该层每一个权值的导数值,即该网络层对应的输入与该层的灵敏度的叉乘值。最终神经元权值的更新就是前面得到的偏导数再乘上一个负的学习率:TlllxWE1(2.13)llWEW(2.14)2.2卷积神经网络的结构卷积神经网络是一种含有多个卷积层的深度网络,其中每层又由多个二维平面组成,另外二维平面又由多个神经元组成,如图2.3所示,其基本网络结构由卷积层、池化层、全连接层、输出层组成。图2.3卷积神经网络的基本网络结构卷积层可看作由许多卷积核组成的一组平行的平面,其输出为一组平行的映射特征图,图像的卷积过程可以看作为原始图像中的像素与卷积核进行加权求和的过程。此过程是通过在输入图像上滑动不同的卷积核并执行卷积操作,其中,在每一次滑动的位置上,输入图像的每个像素点会与卷积核完成一次乘积并求和的运算,最终将感受野的信息投影到特征图中。其每张特征图中的所有元素都是由一个卷积核计算得到的,即每张特征图共享了相同的权重和偏置。一般卷积核的尺寸要远小于输入图像的大小,然而过小的卷积核将会出现不完全覆盖卷积的问题,一般使用图像四周填补0像素操作来控制图像大校设输入图像的尺寸为,,CWH,卷积核的维度为,,ckk21,则经过卷积层得到的特征图为:DSPSPWHDimHkZDW,1/2,1/2),,(KZkZZ21111(2.15)其中1H、1W、1D分别表示一张特征图的高度、宽度和深度,pZ为周边补0的P填补
【参考文献】:
期刊论文
[1]基于级联Adaboost和神经网络主元分析算法的人脸检测系统[J]. 李振雨,王好臣,王功亮,李家鹏. 科学技术与工程. 2018(01)
[2]Recent advances in efficient computation of deep convolutional neural networks[J]. Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU. Frontiers of Information Technology & Electronic Engineering. 2018(01)
[3]基于跨连卷积神经网络的性别分类模型[J]. 张婷,李玉鑑,胡海鹤,张亚红. 自动化学报. 2016(06)
[4]基于卷积神经网络的人脸性别识别[J]. 汪济民,陆建峰. 现代电子技术. 2015(07)
[5]一种基于卷积神经网络的性别识别方法[J]. 蔡诗威,郭太良,姚剑敏. 电视技术. 2014(19)
[6]人脸检测技术现状与发展研究[J]. 霍鹏. 科技信息. 2012(24)
[7]基于改进BP网络的人脸检测与定位[J]. 周彩霞,易江义. 科学技术与工程. 2008(06)
[8]基于局部二元模式算子的人脸性别分类方法[J]. 孙宁,冀贞海,邹采荣,赵力. 华中科技大学学报(自然科学版). 2007(S1)
[9]融合AdaBoost和启发式特征搜索的人脸性别分类[J]. 朱文球,刘强. 计算机工程. 2007(02)
[10]基于支持向量AAM迭代学习的性别分类算法[J]. 陈华杰,韦巍. 浙江大学学报(工学版). 2005(12)
本文编号:2927502
【文章来源】:河北工业大学天津市 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
神经元结构示意图
自然场景下基于卷积神经网络的人脸检测与人脸性别识别研究-10-niiixw1(2.2)则激活函数f变为如下定义:0,001,fy(2.3)即如果0,此时这个神经元被激活,处于兴奋状态,f1;当0时,该神经元被抑制,f0。2.1.2前向传播算法前向传播算法(ForwardPropagation,FP)指在卷积神经网络中由前向后依次进行的推导算法。以简单的三层神经网络为例,如图2.2所示,三层网络由输入层、输出层及隐藏层组成。前向传播为首先将数据从输入层传递给中间的隐藏层,之后再将隐藏层的输出传给输出层,经输出层得到最后的输出结果,整个前向传播过程中每一层神经元状态只会对下一层的神经元产生影响。图2.2三层网络结构示意图假定输入层存在s个神经元,此层神经元用i表示;中间隐藏层有t个神经元,用j表示;最后的输出层有o个神经元,用k来表示。jiv表示i与j连接时对应的权值,kjw表示j与k连接时对应ix的权值。用.1f表示中间隐藏层的激活函数,.2f为输出层对应的激活函数。若输入值为ix,其中si,,...,0那么对于隐藏层的每个神经元输出的值可表示为:t,...,2,1,01jxvfzsiijik(2.4)输出层的每个神经元输出的值为:o,...,2,1,02kzwfyqjkkjj(2.5)
自然场景下基于卷积神经网络的人脸检测与人脸性别识别研究-12-"tyufnnll)((2.12)最后,通过采用灵敏度值对每个神经元进行权值更新。其中第l层的误差对于该层每一个权值的导数值,即该网络层对应的输入与该层的灵敏度的叉乘值。最终神经元权值的更新就是前面得到的偏导数再乘上一个负的学习率:TlllxWE1(2.13)llWEW(2.14)2.2卷积神经网络的结构卷积神经网络是一种含有多个卷积层的深度网络,其中每层又由多个二维平面组成,另外二维平面又由多个神经元组成,如图2.3所示,其基本网络结构由卷积层、池化层、全连接层、输出层组成。图2.3卷积神经网络的基本网络结构卷积层可看作由许多卷积核组成的一组平行的平面,其输出为一组平行的映射特征图,图像的卷积过程可以看作为原始图像中的像素与卷积核进行加权求和的过程。此过程是通过在输入图像上滑动不同的卷积核并执行卷积操作,其中,在每一次滑动的位置上,输入图像的每个像素点会与卷积核完成一次乘积并求和的运算,最终将感受野的信息投影到特征图中。其每张特征图中的所有元素都是由一个卷积核计算得到的,即每张特征图共享了相同的权重和偏置。一般卷积核的尺寸要远小于输入图像的大小,然而过小的卷积核将会出现不完全覆盖卷积的问题,一般使用图像四周填补0像素操作来控制图像大校设输入图像的尺寸为,,CWH,卷积核的维度为,,ckk21,则经过卷积层得到的特征图为:DSPSPWHDimHkZDW,1/2,1/2),,(KZkZZ21111(2.15)其中1H、1W、1D分别表示一张特征图的高度、宽度和深度,pZ为周边补0的P填补
【参考文献】:
期刊论文
[1]基于级联Adaboost和神经网络主元分析算法的人脸检测系统[J]. 李振雨,王好臣,王功亮,李家鹏. 科学技术与工程. 2018(01)
[2]Recent advances in efficient computation of deep convolutional neural networks[J]. Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU. Frontiers of Information Technology & Electronic Engineering. 2018(01)
[3]基于跨连卷积神经网络的性别分类模型[J]. 张婷,李玉鑑,胡海鹤,张亚红. 自动化学报. 2016(06)
[4]基于卷积神经网络的人脸性别识别[J]. 汪济民,陆建峰. 现代电子技术. 2015(07)
[5]一种基于卷积神经网络的性别识别方法[J]. 蔡诗威,郭太良,姚剑敏. 电视技术. 2014(19)
[6]人脸检测技术现状与发展研究[J]. 霍鹏. 科技信息. 2012(24)
[7]基于改进BP网络的人脸检测与定位[J]. 周彩霞,易江义. 科学技术与工程. 2008(06)
[8]基于局部二元模式算子的人脸性别分类方法[J]. 孙宁,冀贞海,邹采荣,赵力. 华中科技大学学报(自然科学版). 2007(S1)
[9]融合AdaBoost和启发式特征搜索的人脸性别分类[J]. 朱文球,刘强. 计算机工程. 2007(02)
[10]基于支持向量AAM迭代学习的性别分类算法[J]. 陈华杰,韦巍. 浙江大学学报(工学版). 2005(12)
本文编号:2927502
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2927502.html